کاهش خطای طبقه بندی مدل مخفی مارکوف در بازشناسی گفتار فارسی با بکارگیری الگوریتم ژنتیکی در روند آموزش
سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 4,527
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICTM02_083
تاریخ نمایه سازی: 9 دی 1385
چکیده مقاله:
مدل مخفی مارکوف به عنوان یکی از مهمترین ابزارهای تحلیل دنباله های تصادفی با یک ساختارحالت متناهی معرفی شده است. امروزه اکثر سیستم های بازشناسی گفتار موفق مبتنی بر مدل سازی آماری، به کمک مدل مخفی مارکوف (HMM) عمل می کنند. زیرا الگوریتم های قوی و کارای بیشترین میزان شباهت، جهت یافتن پارامترهای مدل مخفی مارکوف ارائه شده اند. که با معلوم بودن ساختار مل و با استفاده از مجموعه ی دادگان آموزشی مناسب، می توانند پارامترهای مدل را با تخمین خوبی بدست آورند. اما هیچ تضمینی وجود ندارد که مدل بهینه ی بدست آمده، بهینه ی سراسری نیز باشد. از معایب دیگر این روشهای آموزش HMM، آن است که ملاک بیشترین میزان شباهت، توجهی به دقت بازشناسی سیستم نهایی ندارد. به عبارت دیگر، هر مدل بطور جداگانه و صرف نظر از وجود مدل های دیگر، به گونه ای آموزش می بیند که تا حد امکان بر نمونه های متناظر از مجموعه ی دادگان آموزشی منطبق کردد. روش کمترین خطای طبقه بندی ، یک الگوریتم تمایزی است که دقت بالاتری را نسبت به الگوریتم های بیشترین میزان شباهت نتیجه می دهد. مشکل اصلی این روش ناهموار بودن تابع تخمین نرخ خطاست. به همین دلیل استفاده از متد جستجوی گرادیان منجر به حصول بهینه محلی می گردد در این مقاله با بکارگیری الگوریتم ژنتیکی (GA) که قابلیت جستجوی بهینه ی عمومی را داراست و نیز با ایده گرفتن از روش آموزشی تمایزی MCE، در روند اموزش، پارامترهای مدل مخفی مارکوف پیوسته یک سیستم بازشناسی گفتار فارسی، طوری بدست آورده می شود که منجر به کاهش خطای طبقه بندی و در نتیجه بهبود دقت بازشناسی شود.
کلیدواژه ها:
نویسندگان
هدیه ساجدی
دانشجوی کارشناسی ارشد دانشگاه صنعتی شریف
حسین ثامنی
استادیار دانشگاه صنعتی شریف
حمید بیگی
استادیار دانشگاه صنعتی شریف
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :