مقاومسازی سیستمهای بازشناسی گوینده در مقابل اعوجاج کانال و کاهش پهنای باند

  • سال انتشار: 1387
  • محل انتشار: دومین کنگره مشترک سیستمهای فازی و هوشمند ایران
  • کد COI اختصاصی: FJCFIS02_334
  • زبان مقاله: فارسی
  • تعداد مشاهده: 511
دانلود فایل این مقاله

نویسندگان

امیرحسین حاج احمدی

آزمایشگاه سیستمهای هوشمند صوتی-گفتاری، دانشکده مهندسی کامپیوتر و فن

محمدمهدی همایون پور

سیدمحمد احدی

دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر، تهران، ایران

چکیده

با توجه به اهمیت مقاومسازی سیستمهای بازشناسی گوینده در مقابل انواع اعوجاح کانال و نویزهای ناشی از نوع میکروفونها در امکان استفاده عملی از آنها، در این مقاله روش استخراج پیکهای طیف دنباله خودهمبستگی که از روشهای مقاومسازیسیستمهای بازشناسی گفتار در مقابل نویزهای جمعشونده است، برای استفاده در سیستمهای تعیین هویت گوینده با ویژگیهای رایج MFCCمقایسه شدهاند. همچنین تأثیر روش پس پردازش حذف میانگین کپسترال نیز بر روی ویژگیهایMFCCو پیکهای طیف دنباله خودهمبستگی مورد ارزیابی قرار گرفته است. بدین منظور پنج نوع نویز کانال مختلف با دادگان تمیز کانولو شده و بازشناسی بر روی این دادگان نهایی انجام شده است. نتایج نهایی بدست آمده نشاندهنده مقاومت بیشتر پیکهای طیف دنباله خودهمبستگی در مقابل کاهش پنهای باند است و تأثیر نویزهای کانولوشنی بر پیکهای طیفدنباله خودهمبستگی بیشتر از ویژگیهایMFCCاست. همچنین از نتایج بدست آمده میتوان نتیجه گرفت که با استفاده از حذف میانگین کپسترال میتوان به میزان بسیار قابل توجهی بر مقاومت در مقابل تأثیرات کانالهای مختلف افزود.

کلیدواژه ها

بازشناسی گوینده، استخراج ویژگی مقاوم، اعوجاج کانال، پیکهای طیف دنباله خودهمبستگی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.