بکارگیری روشهای تطبیق به گوینده سریع بر مبنای فارسیMLLRدر سیستم بازشناسی گفتارفارسی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,380

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE21_003

تاریخ نمایه سازی: 27 مرداد 1392

چکیده مقاله:

روش رگرسیون خطی بیشینه درستنمایی ) MLLR ( یکی از متداولترین روشهای تطبیق به گوینده است که در داده تطبیقی کافی میتواند عملکرد خوبی را از خود به نمایش بگذارد. اما وقتی میزان داده تطبیقی کاهش مییابد، این روش نمیتواند به خوبی عمل کند. در این مقاله، دو روش تطبیق به گوینده MLLR بر مبنای آنالیز مؤلفههای اساسی ) PCA ( یا EMLLR و PCA احتمالاتی به منظور برطرف کردن اینمشکل بکار گرفته شدهاند. در روش دوم، مزایای سه روش تطبیق به گوینده متداول بیشینه پسینه ) MAP (، رگرسیون خطی بیشنیه درست نمایی ) MLLR ( و صدای ویژه ) EV ( با یگدیگر ترکیب شده است. در این روش، اطلاعات مربوط به تغییرات آوای یک گوینده که توسط ماتریس تبدیل MLLR مربوط به آن گوینده مشخص میشوند یک ابربردار را میسازند. با اعمال PCA احتمالاتی به فضای ابربردارهای تشکیل شده ازتغییرات آوای مربوط به تمامی گویندگان تعلیمی، یک مدل احتمالاتی برای تولید ماتریس تبدیل گوینده جدید بوجود میآید که با استفاده از تخمین MAP میتوان این ماتریس را محاسبه کرد. نتایج آزمایشات نشان میدهند که روش دوم در مقادیر مختلف از داده تطبیقی سرپرستیشده و بدون سرپرستی بخصوص در داده تطبیقی کوتاه عملکرد خوبی را نسبت به روش EMLLR و MLLR از خود نشان میدهد

کلیدواژه ها:

آنالیز مؤلفه های اساسی احتمالاتی ، تطبیق به گوینده ، رگرسیون خطی بیشینه درست نمایی ، فضای ویژه

نویسندگان

زهره انصاری

دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

سعید شیری قیداری

دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسی کامپیوتر

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسیپزشکی، آزمایشگاه پردازش گفتار