بهبود روش MLLR با استفاده از MCE و دانش آوائی برای تطبیق گوینده

  • سال انتشار: 1389
  • محل انتشار: شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: CSICC16_039
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1427
دانلود فایل این مقاله

نویسندگان

رضا صحرائیان

دانشکده مهندسی برق،دانشگاه علم و صنعت،ایران

بهزاد زمانی

دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت ایران،تهران

احمد اکبری

احمد آیت اللهی

چکیده

روش رگرسیون خطی با بیشینه درست نمایی MLLR) یکی از روشهای تطبیق گویندهاست که با خوشه بندی پارامترهای مدل و تخمین ماتریس تبدیل برای هر خوشه و اعمال تبدیل برپارامترهای مدل باعث بهبود عملکرد تطبیق و درنتیجه افزایش نرخ بازشناسی برای گوینده جدید می شود خوشه بندی پارامترهای مدل معمولا بدوصوت انجام می شود براساس دانش آوایی و نزدیکی ویژگیها در فضای آکوستیکی، دراین مقاله با استفاده از روش متمایز سازی خطای کمینه کلاس بندی با متمایز کردن ویژگیهای سیگنال گفتار با بهبود کلاس بندی کارایی روش MLLR) بهبود یافته است این بهبود در حالت اول با متمایز کردن کلاسهای رگرسیون و درحالت دوم با یکنواخت کردن توزیع مخلوط های گوسی در کلاسهای رگرسیون ایجاد می شود روش پیشنهادی یعنی بکارگیری خطای کمینه کلاسبندی نسبت به روشهای معادل بدون خطای کمینه کلاسبندی به ترتیب باعث افزایش نسبی 0.42% تا 0.58% و 0.12% تا 0.72% درنرخ بازشناسی واج به ترتیب برای دادگان WSJ TIMIT می گردد درحالتی که درخت کلاس رگرسیون براساس نزدیکی ویژگیها در فضای آکوستیکی ساخته شده است نرخ بازشناسی واج برروی دادگان TIMIT 0.25% افزایش نسبی یافته است.

کلیدواژه ها

بیشینه درست نمائی با رگرسیون خطی،تطبیق گوینده،کمترین خطای رده بندی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.