ویژگی جدید، مقاوم و زمان بلند بی نظمی زمانی برای آشکارسازی گفتار

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 550

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ELEMECHCONF04_548

تاریخ نمایه سازی: 11 مرداد 1396

چکیده مقاله:

سیستم های شناسایی گفتار را میتوان نوعی از سیستم های دسته بندی کننده ی سیگنال های صوتی دانست که از آنها برای شناسایی، آشکارسازی و یا نشانه گذاری قسمت هایی از سیگنال صوتی که شامل گفتار انسان است، استفاده می شود. در اینجا میخواهیم روش جدید، مقاوم و زمان بلند بینظمی زمانی - (LTTE) Long-Term Time Entropy را برای آشکارسازی گفتار معرفی کنیم و هدف از ارایه این ویژگی این بوده که هم خود ویژگی به تنهایی عملکرد مناسبی داشته باشد و هم اینکه در ترکیب با سایر ویژگی ها سبب بهبود عملکرد و افزایش دقت شناسایی شود. برای این منظور روش پیشنهاد شده را با سایر روش های جدید و معروف این حوزه در شرایط گوناگون به سنجش گذاشتیم. نتایج آزمایش ها بر روی مجموعه ی داده MUSAN ، نشاندهنده ی بهبود عملکرد سیستم آشکارساز گفتار در صورت ترکیب ویژگی LTTE با سایر ویژگی ها می باشد و همچنین این ویژگی به تنهایی و در مقایسه با ویژگی های همرده اش، دقت عملکرد بالاتری را دارا می باشد.

کلیدواژه ها:

آشکارساازی گفتاار ، Voice Activity Detection (VAD) ، robust feature extraction ،

نویسندگان

محمد رسول کهریزی

دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه

سیدجهانشاه کبودیان

دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه رازی کرمانشاه