بهبود کیفیت گفتار با استفاده از بازنمایی تنک در فضای اسپکتروگرام شنیداری
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 28
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
DMECONF10_225
تاریخ نمایه سازی: 1 مرداد 1404
چکیده مقاله:
در این پژوهش، روشی جدید برای بهبود کیفیت گفتار ارائه شده است. در این الگوریتم با استفاده از اسپکتروگرام شنیداری (فضای دو بعدی (STRF و با کمک بازنمایی، تنک لغت نامه های با اندازه های اتمهای متفاوت ساخته شد. برای آموزش لغت نامه از الگوریتم KSVD و الگوریتم NMF بهره می بریم. روش پیشنهادی نتایج خوبی را در حذف نویز سفید نشان می دهد. بطور مثال PESQ در حضور نویز سفید و در SNRهای پایین بیش از یک واحد افزایش یافته است. البته این روش در نویزهای رنگی نیز نتایج مطلوبی را حاصل می کند. بطور مثال در SNR ۱۰dB نویز همه مه ۲.۶۲۹ PESQ و در نویز خودرو ۲.۶۷۲ PESQ است.
کلیدواژه ها:
نویسندگان
محدثه اسحاقی
استادیار گروه مهندسی برق، گروه مهندسی برق، واحد تهران مرکزی، دانشگاه آزاد اسلامی تهران