آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 332

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

EESCONF05_052

تاریخ نمایه سازی: 27 مرداد 1400

چکیده مقاله:

در این مقاله یک آشکارسازگفتار VAD بر مبنای بازنمایی تنک و بهنگامسازی اتم های لغت نامه در فضای اسپکتروگرام شنیداری (فضای دوبعدی STRF ) ارائه شده است. در این فضای طیفی زمانی در مرحله اول، طیف نگاره گفتار حاصل شده و در مرحله بعد، طیف نگاره گفتار شنیداری، به دوبعد مقیاس و نرخ تجزیه می شود در سال های اخیر روش تنک جایگاه ویژه ای در روش های پردازش گفتار یافته است، ایده اصلی در این روش، بازسازی هر سیگنال گفتار با استفاده از تعداد محدودی اتم های پایه است. استفاده از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز و بهنگام سازی آنها، باعث جداساز بهتر قسمت های گفتار ونویز می شود. در این الگوریتم با استفاده از فضای دو بعدی STRF و با کمک بازنمایی تنک، لغت نامه های بهنگام Dictionary updating با اندازه اتم های متفاوت حاصل شده که ازروش های یادگیری K-SVD و NMF برای آموزش آنها بهره می بریم. نتایج، حاکی از جواب دهی خوب این روش است، بطورمثال در ۵ SNR= عملکرد آشکارسار گفتار پیشنهادی برای نویز سفید برابر با۹۲.۷۱ % و در نویز ماشین برابر با ۹۱.۲۱ % می باشد. مقایسه نتایج پارامترهای ارزیابی NDS و MSC با روش های دیگر، عملکرد بهتر روش پیشنهادی را نشان می دهد.

نویسندگان

محدثه اسحاقی

گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی ، نوشهر، ایران