بهبود کیفیت گفتار با استفاده از بازنمایی تنک در فضای اسپکتروگرام شنیداری

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 28

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DMECONF10_225

تاریخ نمایه سازی: 1 مرداد 1404

چکیده مقاله:

در این پژوهش، روشی جدید برای بهبود کیفیت گفتار ارائه شده است. در این الگوریتم با استفاده از اسپکتروگرام شنیداری (فضای دو بعدی (STRF و با کمک بازنمایی، تنک لغت نامه های با اندازه های اتمهای متفاوت ساخته شد. برای آموزش لغت نامه از الگوریتم KSVD و الگوریتم NMF بهره می بریم. روش پیشنهادی نتایج خوبی را در حذف نویز سفید نشان می دهد. بطور مثال PESQ در حضور نویز سفید و در SNRهای پایین بیش از یک واحد افزایش یافته است. البته این روش در نویزهای رنگی نیز نتایج مطلوبی را حاصل می کند. بطور مثال در SNR ۱۰dB نویز همه مه ۲.۶۲۹ PESQ و در نویز خودرو ۲.۶۷۲ PESQ است.

نویسندگان

محدثه اسحاقی

استادیار گروه مهندسی برق، گروه مهندسی برق، واحد تهران مرکزی، دانشگاه آزاد اسلامی تهران