کاهش نرخ خطای کلمه در سیستم های تشخیص گفتار با استفاده از ترکیب روش WPE و ارایه های میکروفنی با چیدمان کروی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 492

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISAV10_094

تاریخ نمایه سازی: 18 اسفند 1399

چکیده مقاله:

با توجه به حضور واخنش در محیط های بسته، عملکرد سیستم تشخیص گفتار متناسب با افزایش زمان واخنش TR66 کاهش می یابد و در نتیجه نرخ خطای کلمه افزایش خواهد یافت. شایان ذکر است در محیط هایی که زمان واخنش از نیم ثانیه بیشتر است، نرخ خطای کلمه بطور چشمگیری افزایش می یابد. لذا لازم است یک مرحله علیات بهبود گفتار در ورودی سیستم تشخیص گفتار تعبیه شود. عموما در سیستم های بهبود گفتار، از یک یا چند بخش از بخش های ذیل استفاده می شود. الف) آرایه های میکروفنی، ب) کاهش نویز، ج) کاش واخنش در تحقیقات انجان شده تا به امروز، واخنش بعنوان یکی ازعوامل اصلی کاهش کیفیت گفتار (افازیش خطای سیستم تشخیص گفتار) مطرح شده است. لذا در این پژوهش برای غلبه بر واخنش، استفاده از یک ارایه میکروفنی بصورت ترتیکبی با یک کاهش دهنده واخنش مدنظر است، بصورتی که نرخ خطای کلیه سیستم تشخیص گفتار کاهش یابد از آنجایی که کروی نسبت به آرایه های متداول عملکرد بهتری مخصوصا در فرکانس های پایین دارند. در این پژوهش استفاده از آرایه های میکروفنی کروی پیشنهاد شده است با توجه به اینک WER در سیستم ASR بصورت دائمی قابل اندازه گیری نیست، از FWSegSNR بعنوان یک پارامتری که همبستگی بسیار بالایی با WER دارد، استفاده گردید. روش پیشنهادی FWSegSNR را تا حدود 3 دسی بل افزایش می دهد که بسیار قابل توجه است و می توان استنتاج نمود که WER در یک سیستم ASR بطور قابل ملاحظه ای کاهش می یابد و در نتیجه عملکرد سیستم ASR بهبود قابل توجهی داشته باشد. همچنین بهبود زیاد پارامتر SPMR نشان دهنده اثربخش بودن روش حذف واخنش پیشنهادی است

کلیدواژه ها:

حدف واخنش ، ارایه های میکروفنی کروی ، شکل دهی پرتو

نویسندگان

امیرحسین علی محمدی

ایران تهران دانشگاه صدا و سیما دانشکده فنی و مهندسی رسانه

سارا صادقی

ایران تهران دانشگاه صدا و سیما داشکده فنی و مهندسی رسانه

محمدابراهیم صادقی

ایران تهران دانشگاه صدا و سیما دانشکده فنی و مهندسی رسانه