مدل سازی سه واجی به عنوان واحد آوایی در سیستم های بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,963

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_177

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

برای سیستم های بازشناسی گفتار پیوسته معمولا استفاده از واحدآوایی سه واجی جهت نیل به عملکرد بهتر غیر قابل اجتناب است . مشکل واحدهای آوایی سه واجی تعداد بالای انها و در نتیجه نیاز به دادگان آموزشی بسیار بزرگ برای آموزش تعداد زیاد حالت های مدل می ابشد. برای حل این مشکل و اختصاص داده کافی برای آموزش هر حالت ازمدل مخفی مارکوف، روش مرسوم استفاده از متد گره زدن حالت ها است. در این مقاله، مراحل گره زدن حالت های مربوط به سه واجی ها در روند آموزش یک سیستم بازشناسی گفتار پیوسته فارسی طراحی و اجرا شده است و بر اساس نتایج و عملکرد سیستم بازشناسی، تعداد بهینه حالت های گره زده شده (زنون ها) و پارامترهایی مانند تعداد گوسی های هر حالت برای مجموعه دادگان های فارسی دات بزرگ و کوچک گزارش شده است. میزان کاهش خطا در سیستم بازشناسی گفتار فارسی پس از به کارگیری سه واجی ها حدود 11% بوده است.

کلیدواژه ها:

نویسندگان

نسیبه نصیری

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

حسین صامتی

استادیار و عضو هیئت علمی دانشکده مهندسی کامپوتر دانشگاه صنعتی شریف

محمد بحرانی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

باقر باباعلی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف