الگوریتم جدید بهینه سازی گفتار در فضای طیفی –زمانی با استفاده از بازنمایی تنک

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 325

فایل این مقاله در 13 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IEAMCONF02_054

تاریخ نمایه سازی: 15 تیر 1401

چکیده مقاله:

در این مقاله یک روش جدید برای بهبود کیفیت گفتار بر مبنای بازنمایی تنک در فضای طیفی- زمانی(STRF) ارائه شده است. مولفه های فضای طیفی-زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. مقیاس به معنای مدولاسیون طیفی و نرخ به معنای مدولاسیون زمانی است. با بهره گیری از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز، نتایج بهتری از قسمت های گفتار و نویز حاصل می شود. در این الگوریتم ابتدا گفتار ورودی با استفاده از فضای STRF به مولفه های جهاربعدی فرکانس، زمان، مقیاس و نرخ تبدیل می شود و از آنجایی که تشکیل یک لغت نامه مطلوب با این تعداد مولفه تقریبا غیر ممکن است. برای رفع این مشکل افراز مکعبی هرقاب زمانی مد نظر قرار گرفت و سه ایده با توجه به این افراز پیشنهاد می گردد. به کمک روش تنک و لغت نامه های گفتار و نویز در هر مکعب، تخمین بهتری برای قسمت های گفتار و نویز دست می دهد. در اینجا از الگوریتم NMF برای آموزش لغت نامه بهره می بریم. بطورمثال در SNR=-۱۰dB در نویز سفید PESQ=۲.۷۱۰ و در نویز همهمه PESQ=۲.۶۷۷ حاصل شد که عملکرد مطلوب روش پیشنهادی نسبت به سایر روش ها را نشان می دهد.

نویسندگان

محدثه اسحاقی

گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی، نوشهر، ایران