یک سیستم آشکارساز گوینده مبتنی بر مدل مخلوط گاوسی برای جستجوی مستندات گفتاری در محیطهای واقعی و عملیاتی

  • سال انتشار: 1383
  • محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI10_102
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1079
دانلود فایل این مقاله

نویسندگان

جهانشاه کبودیان

پژوهشکده پردازش هوشمند علائم RCISP تهران

حمیدرضا شجاع مودب

جواد شیخ زادگان

چکیده

دراین مقاله یک سیستم جستجوگر و آشکارساز گوینده مستقل از متن که برای بکارگیری در محیطهای نویزی و عملیاتی طراحی و پیاده سازی شده است معرفی میگ ردد دراولین مرحله از پردازش سیستم فوق با استفاده از یک اشکارساز گفتار VAD مقاوم که در محیط های نویزی و با SNR پایین کارایی بسیار خوبی داردسیگنال گفتار را از سکوت جدا می کند درمرحله استخراج ویژگی از پارامترهای کپسترال MFCC و مشتقات آن که نسبت به پارامترهای کپسترال LPCC مقاومت بیشتری در برابرنویز دارند استفاده می نماید برای رسیدن به بهترین تخمین از پارامترها در مدل مخلوط گاوسی GMM از آموزش دو مرحله ای خوشه بندی سلسله مراتبی و سپس تخمین EM بهره جسته ایم و برای آنکه خاصیت تعمیم مدلها برروی داده های نادیده مطلوب باشد تعداد توابع گوسی در مدل مخلوط گاوسی بصورت تطبیقی تعیین شده است.

کلیدواژه ها

آشکارسازی گوینده، مدل مخلوط گاوسی، محیط های نویزی و واقعی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.