تطبیق گوینده در بازشناسی گفتار پیوسته براساس تخمین MAP مبتنی بر تبدیل MLLR

سعید شریفیان و سید محمد احدی

تطبیق گوینده در بازشناسی گفتار پیوسته براساس تخمین MAP مبتنی بر تبدیل MLLR

محل انتشار: دوفصلنامه روشهای عددی در مهندسی، دوره: 23، شماره: 2

سال انتشار: 1383

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 117

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1442202

شناسه ملی سند علمی:

JR_JCME-23-2_004

تاریخ نمایه سازی: 19 اردیبهشت 1401

چکیده مقاله:

روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیده اند. در برخی روشها نظیر تخمین MAP تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی می شوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتا زیادی مورد نیاز است. در برخی دیگر نظیر MLLR که تعدادی تبدیلات عمومی بر روی خوشه های مدلها اعمال می شود، برای دادگان کم آموزشی نتایج مطلوبی حاصل می شود، اما با افزایش دادگان، کارایی به حد اشباع می رسد. در این مقاله روش جدیدی مطرح می شود که از مزایای هر دو روش فوق برای دسترسی به کیفیت بالاتر بهره می برد. در این روش مدلهایی که داده آموزشی آنها موجود است به کمک تخمین MAP آموزش می بینند و برای مدلهایی که داده آموزشی (کافی) ندارند، با استفاده از روش MLLR مقادیر پیشینه مناسب برای تخمین MAP تامین می شود. این روش، در عمل، بر روی یک سیستم آموزش دیده براساس دادگان فارس دات به نتایج بهتری نسبت به هر یک از دو روش MAP و MLLR دست یافته است.

کلیدواژه ها:

Hidden Markov models (HMM) ، continuous Persian (Farsi) speech recognition ، Speaker adaptation ، MAP estimation ، MLLR transformation. ، مدلهای مارکوف پنهان (HMM) ، بازشناسی گفتار پیوسته فارسی ، تطبیق گوینده ، تخمین MAP ، تبدیل MLLR

نویسندگان

سعید شریفیان و سید محمد احدی