بهبود روش MLLR با استفاده از MCE و دانش آوائی برای تطبیق گوینده
محل انتشار: شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,258
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSICC16_039
تاریخ نمایه سازی: 28 بهمن 1390
چکیده مقاله:
روش رگرسیون خطی با بیشینه درست نمایی MLLR) یکی از روشهای تطبیق گویندهاست که با خوشه بندی پارامترهای مدل و تخمین ماتریس تبدیل برای هر خوشه و اعمال تبدیل برپارامترهای مدل باعث بهبود عملکرد تطبیق و درنتیجه افزایش نرخ بازشناسی برای گوینده جدید می شود خوشه بندی پارامترهای مدل معمولا بدوصوت انجام می شود براساس دانش آوایی و نزدیکی ویژگیها در فضای آکوستیکی، دراین مقاله با استفاده از روش متمایز سازی خطای کمینه کلاس بندی با متمایز کردن ویژگیهای سیگنال گفتار با بهبود کلاس بندی کارایی روش MLLR) بهبود یافته است این بهبود در حالت اول با متمایز کردن کلاسهای رگرسیون و درحالت دوم با یکنواخت کردن توزیع مخلوط های گوسی در کلاسهای رگرسیون ایجاد می شود روش پیشنهادی یعنی بکارگیری خطای کمینه کلاسبندی نسبت به روشهای معادل بدون خطای کمینه کلاسبندی به ترتیب باعث افزایش نسبی 0.42% تا 0.58% و 0.12% تا 0.72% درنرخ بازشناسی واج به ترتیب برای دادگان WSJ TIMIT می گردد درحالتی که درخت کلاس رگرسیون براساس نزدیکی ویژگیها در فضای آکوستیکی ساخته شده است نرخ بازشناسی واج برروی دادگان TIMIT 0.25% افزایش نسبی یافته است.
کلیدواژه ها:
نویسندگان
رضا صحرائیان
دانشکده مهندسی برق،دانشگاه علم و صنعت،ایران
بهزاد زمانی
دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت ایران،تهران