بهبود نرخ بازشناسی گفتار فارسی با استفاده از تطبیق مدل های زبانی مولد PLSA و LDA

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 838

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CESD01_129

تاریخ نمایه سازی: 25 اسفند 1392

چکیده مقاله:

مدل های زبانی با تعیین دنباله کلمات محتمل، دقت سامانه بازشناسی گفتار را بهبود می دهند. به علت پیچیدگی ساختار نحوی زبان طبیعی، در دو دهه اخیر به مدل های زبانی آماری توجه بیشتری شده است. سامانه بازشناسی گفتار به شدت تحت تأثیرویژگی های لغوی، نحوی، و معنایی سخنان آموزش دیده است؛ بنابراین بسیار وابسته به حوزه های متفاوت گفتار است. به طور کلی، مدل زبانی تطبیق یافته تحت شرایط متغیرکه شامل تغییرات بالقوه لغت،نحو،محتوا،و سبک است، به دنبال حفظ اطلاعات کافی حوزه بازشناسی جاری است.هدف تطبیق مدل های آماری، استخراج اطلاعات مشخص، و البته محدود، پیرامون موضوع گفتار به منظور جبران این نقص است. در این مقاله اطلاعات معنایی استخراج شده توسط مدل های مولد PLSA و LDA به مدل آماری زبانی پایه افزوده شده و نشان داده می شود که این اطلاعات بهبود 87.1 و 8781 درصدی نرخ بازشناسی گفتار فارسی رابه ترتیب برای روشهای LDA و PLSA به همراه دارد.

نویسندگان

سید مهدی حسینی

هیئت علمی موسسه آموزش عالی شفق تنکابن

بهروز مینایی بیدگلی

استادیار دانشگاه علم و صنعت ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Andreas Stolcke, Jing Zheng, Wen Wang, and Victor Abras. 2011. ...
  • Bellegarda, J. R., "Statistical Language Model Adaptation: Review and Perspectives" ...
  • Blei, D. M., Ng, A. Y., & Jordan, M. I. ...
  • C. Martins, A. Teixeira, and J. Neto, "Language Models in ...
  • D. Blei. Introduction o probabilistic topic models. Commun icationsof the ...
  • Griffiths, T. L., &Steyvers, M. (2005). Finding scientific topics. Proceedings ...
  • Jen-TzungCh ien and C hu ang-HuaChueh _ Dirichlet clas language ...
  • Jonathan K.Pritchard, Matthew Stephens, and Peter Donnelly. Inference of population ...
  • Thomas Griffiths. Gibbs sampling in the generative model of latent ...
  • Thomas Minka and John Lafferty. Exp ectation-prop agation for the ...
  • Zhai, C. 2008. Statistical Language Models for Information Retrieval A ...
  • نمایش کامل مراجع