افزایش قابلیت فهم گفتار در محیط های نویزی با استفاده از تبدیل موجک و انرژی غیر خطی

  • سال انتشار: 1392
  • محل انتشار: بیست و یکمین کنفرانس مهندسی برق ایران
  • کد COI اختصاصی: ICEE21_001
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1848
دانلود فایل این مقاله

نویسندگان

علیرضا بهزادی

آزمایشگاه پردازش سیگنال دانشگاه صنعتی نوشیروانی بابل

محمدرضا کرمی ملائی

دانشیاردانشگاه صنعتی نوشیروانی بابل

راحله غلامی

آزمایشگاه پردازش سیگنال دانشگاه صنعتی نوشیروانی بابل

رضا قادری

دانشیار دانشگاه صنعتی نوشیروانی بابل

چکیده

در برخی روش های بهسازی گفتار، با فرض در دسترس بودن سیگنال تمیز، بگونه ای عمل می شود که قابلیت فهم گفتار تمیز،قبل از تضعیف سیگنال در اثر نویز افزایش داده شود. در این روش ها ابتدا مولفه های گذرا در سیگنال گفتار را مشخص نموده و سپس باتقویت آن ها و ترکیب مجدد با سیگنال اصلی، سیگنال بهسازی شده حاصل می شود. در این پژوهش الگوریتم جدیدی بر مبنای تبدیل بستهموجک و استخراج مولفه های گذرای سیگنال برای افزایش قابلیت فهم گفتار در زمان بلادرنگ ارائه شده است. برای کاهش زمان پردازش، الگوریتم کلاسه بندی پاکت ها با استفاده از واریانس انرژی پاکت ها و روش K-means پیشنهاد داده شده است و سپس با استفاده از انرژیغیرخطی، مولفه های گذرای سیگنال گفتار محاسبه شده و از آن برای افزایش قابلیت فهم گفتار استفاده می شود. بررسی نتایج آزمایش ها افزایش قابلیت فهم گفتار را نسبت به سیگنال اصلی نشان می دهد. بطور مثال در سیگنال به نویز dB -52 روش پیشنهادی 9.81 درصد بیشتر از سیگنال اصلی قابلیت فهم را بهبود داده است

کلیدواژه ها

انرژی غیرخطی، بهسازی گفتار، تابع گذرا ، تبدیل موجک

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.