ویژگی جدید، مقاوم و زمان بلند بی نظمی زمانی برای آشکارسازی گفتار

محمد رسول کهریزی; سیدجهانشاه کبودیان

ویژگی جدید، مقاوم و زمان بلند بی نظمی زمانی برای آشکارسازی گفتار

محل انتشار: چهارمین کنفرانس ملی و دومین کنفرانس بین المللی پژوهش های کاربردی در مهندسی برق، مکانیک و مکاترونیک

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 550

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/692614

شناسه ملی سند علمی:

ELEMECHCONF04_548

تاریخ نمایه سازی: 11 مرداد 1396

چکیده مقاله:

سیستم های شناسایی گفتار را میتوان نوعی از سیستم های دسته بندی کننده ی سیگنال های صوتی دانست که از آنها برای شناسایی، آشکارسازی و یا نشانه گذاری قسمت هایی از سیگنال صوتی که شامل گفتار انسان است، استفاده می شود. در اینجا میخواهیم روش جدید، مقاوم و زمان بلند بینظمی زمانی - (LTTE) Long-Term Time Entropy را برای آشکارسازی گفتار معرفی کنیم و هدف از ارایه این ویژگی این بوده که هم خود ویژگی به تنهایی عملکرد مناسبی داشته باشد و هم اینکه در ترکیب با سایر ویژگی ها سبب بهبود عملکرد و افزایش دقت شناسایی شود. برای این منظور روش پیشنهاد شده را با سایر روش های جدید و معروف این حوزه در شرایط گوناگون به سنجش گذاشتیم. نتایج آزمایش ها بر روی مجموعه ی داده MUSAN ، نشاندهنده ی بهبود عملکرد سیستم آشکارساز گفتار در صورت ترکیب ویژگی LTTE با سایر ویژگی ها می باشد و همچنین این ویژگی به تنهایی و در مقایسه با ویژگی های همرده اش، دقت عملکرد بالاتری را دارا می باشد.

کلیدواژه ها:

آشکارساازی گفتاار ، Voice Activity Detection (VAD) ، robust feature extraction ،

نویسندگان

محمد رسول کهریزی

دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه

سیدجهانشاه کبودیان

دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه