آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام در فضای طیفی زمانی

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 305

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

EESCONF05_051

تاریخ نمایه سازی: 27 مرداد 1400

چکیده مقاله:

در این مقاله یک الگوریتم برای آشکارسازگفتار VAD بر مبنای بازنمایی تنک و بهنگام سازی اتم های لغت نامه در فضای طیفی زمانی STRF ارائه شده است. مولفه های فضای طیفی زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. مقیاس به معنای مدولاسیون طیفی و نرخ به معنای مدولاسیون زمانی است. از سوی دیگر، استفاده از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز و بهنگام سازی آنها ، باعث جداساز بهتر قسمت های گفتار ونویز می شود. در این الگوریتم ابتدا گفتار ورودی با استفاده از فضای STRF به مولفه های جهاربعدی فرکانس، زمان، مقیاس و نرخ تبدیل می شود و از آنجایی که تشکیل یک لغت نامه مطلوب با این تعداد مولفه تقریبا غیر ممکن است. برای رفع این مشکل افراز مکعبی هرقاب زمانی مد نظر قرار گرفت. سپس به کمک روش تنک و لغت نامه های بهنگام Dictionary updating گفتار و نویز در هر مکعب، قسمت های گفتار و غیرگفتار سیگنال ورودی از هم جدا می شود. در اینجا از الگوریتم NMF برای آموزش لغت نامه بهره می بریم. بطورمثال نتایج در SNR های کمتر از ۰ عملکرد آشکارسار گفتار پیشنهادی برای نویر سفید و ماشین بیشتر از ۹۲% و ۹۵ % می باشد که عملکرد بهتر آشکارساز گفتار پیشنهادی نسبت به سایر روش ها را نشان می دهد

نویسندگان

محدثه اسحاقی

گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی ، نوشهر، ایران