بهبود نرخ بازشناسی گفتار فارسی با استفاده از تطبیق مدل های زبانی مولد PLSA و LDA
- سال انتشار: 1392
- محل انتشار: همایش مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدلسازی و امنیت سیستم ها
- کد COI اختصاصی: CESD01_129
- زبان مقاله: فارسی
- تعداد مشاهده: 769
نویسندگان
هیئت علمی موسسه آموزش عالی شفق تنکابن
استادیار دانشگاه علم و صنعت ایران
چکیده
مدل های زبانی با تعیین دنباله کلمات محتمل، دقت سامانه بازشناسی گفتار را بهبود می دهند. به علت پیچیدگی ساختار نحوی زبان طبیعی، در دو دهه اخیر به مدل های زبانی آماری توجه بیشتری شده است. سامانه بازشناسی گفتار به شدت تحت تأثیرویژگی های لغوی، نحوی، و معنایی سخنان آموزش دیده است؛ بنابراین بسیار وابسته به حوزه های متفاوت گفتار است. به طور کلی، مدل زبانی تطبیق یافته تحت شرایط متغیرکه شامل تغییرات بالقوه لغت،نحو،محتوا،و سبک است، به دنبال حفظ اطلاعات کافی حوزه بازشناسی جاری است.هدف تطبیق مدل های آماری، استخراج اطلاعات مشخص، و البته محدود، پیرامون موضوع گفتار به منظور جبران این نقص است. در این مقاله اطلاعات معنایی استخراج شده توسط مدل های مولد PLSA و LDA به مدل آماری زبانی پایه افزوده شده و نشان داده می شود که این اطلاعات بهبود 87.1 و 8781 درصدی نرخ بازشناسی گفتار فارسی رابه ترتیب برای روشهای LDA و PLSA به همراه دارد.کلیدواژه ها
تطبیق آماری مدل زبانی، بازشناسی گفتار، پیکرهپس زمینه، پیکره تطبیق، ترکیب، استخراج ویژگی معناییمقالات مرتبط جدید
- سیستم تشخیص نفوذ در محیط رایانش ابری با استفاده از یادگیری ویژ گی
- کاهش هزینه تعمیراتی ماشین های سنگین از طریق بهبود الگوریتم درخت تصمیم با الگوریتم های انتخاب ویژگی Information Gain ،Correlation و SVM
- پردازش کوانتومی تصاویر پزشکی و تشخیص لبه آن با استفاده از الگوریتم QHED
- بررسی و مقایسه روشهای تشخیص اکانت های جعلی در شبکه های اجتماعی
- مکان یابی و مقدار بهینه منابع تولید پراکنده به منظورکاهش تلفات و بهبود انحراف ولتاژ شبکه نامتعادل توزیع
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.