بهبود روش MLLR با استفاده از MCE و دانش آوائی برای تطبیق گوینده

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,258

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC16_039

تاریخ نمایه سازی: 28 بهمن 1390

چکیده مقاله:

روش رگرسیون خطی با بیشینه درست نمایی MLLR) یکی از روشهای تطبیق گویندهاست که با خوشه بندی پارامترهای مدل و تخمین ماتریس تبدیل برای هر خوشه و اعمال تبدیل برپارامترهای مدل باعث بهبود عملکرد تطبیق و درنتیجه افزایش نرخ بازشناسی برای گوینده جدید می شود خوشه بندی پارامترهای مدل معمولا بدوصوت انجام می شود براساس دانش آوایی و نزدیکی ویژگیها در فضای آکوستیکی، دراین مقاله با استفاده از روش متمایز سازی خطای کمینه کلاس بندی با متمایز کردن ویژگیهای سیگنال گفتار با بهبود کلاس بندی کارایی روش MLLR) بهبود یافته است این بهبود در حالت اول با متمایز کردن کلاسهای رگرسیون و درحالت دوم با یکنواخت کردن توزیع مخلوط های گوسی در کلاسهای رگرسیون ایجاد می شود روش پیشنهادی یعنی بکارگیری خطای کمینه کلاسبندی نسبت به روشهای معادل بدون خطای کمینه کلاسبندی به ترتیب باعث افزایش نسبی 0.42% تا 0.58% و 0.12% تا 0.72% درنرخ بازشناسی واج به ترتیب برای دادگان WSJ TIMIT می گردد درحالتی که درخت کلاس رگرسیون براساس نزدیکی ویژگیها در فضای آکوستیکی ساخته شده است نرخ بازشناسی واج برروی دادگان TIMIT 0.25% افزایش نسبی یافته است.

کلیدواژه ها:

بیشینه درست نمائی با رگرسیون خطی ، تطبیق گوینده ، کمترین خطای رده بندی

نویسندگان

رضا صحرائیان

دانشکده مهندسی برق،دانشگاه علم و صنعت،ایران

بهزاد زمانی

دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت ایران،تهران