بهبود نرخ بازشناسی گفتار فارسی با استفاده از تطبیق مدل های زبانی مولد PLSA و LDA

سال انتشار: 1392
محل انتشار: همایش مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدلسازی و امنیت سیستم ها
کد COI اختصاصی: CESD01_129
زبان مقاله: فارسی
تعداد مشاهده: 769

نویسندگان

هیئت علمی موسسه آموزش عالی شفق تنکابن

استادیار دانشگاه علم و صنعت ایران

چکیده

مدل های زبانی با تعیین دنباله کلمات محتمل، دقت سامانه بازشناسی گفتار را بهبود می دهند. به علت پیچیدگی ساختار نحوی زبان طبیعی، در دو دهه اخیر به مدل های زبانی آماری توجه بیشتری شده است. سامانه بازشناسی گفتار به شدت تحت تأثیرویژگی های لغوی، نحوی، و معنایی سخنان آموزش دیده است؛ بنابراین بسیار وابسته به حوزه های متفاوت گفتار است. به طور کلی، مدل زبانی تطبیق یافته تحت شرایط متغیرکه شامل تغییرات بالقوه لغت،نحو،محتوا،و سبک است، به دنبال حفظ اطلاعات کافی حوزه بازشناسی جاری است.هدف تطبیق مدل های آماری، استخراج اطلاعات مشخص، و البته محدود، پیرامون موضوع گفتار به منظور جبران این نقص است. در این مقاله اطلاعات معنایی استخراج شده توسط مدل های مولد PLSA و LDA به مدل آماری زبانی پایه افزوده شده و نشان داده می شود که این اطلاعات بهبود 87.1 و 8781 درصدی نرخ بازشناسی گفتار فارسی رابه ترتیب برای روشهای LDA و PLSA به همراه دارد.

کلیدواژه ها

تطبیق آماری مدل زبانی، بازشناسی گفتار، پیکرهپس زمینه، پیکره تطبیق، ترکیب، استخراج ویژگی معنایی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.