استخراج و استفاده از معیار اطمینان کلمات در بازشناسی گفتار پیوسته فارسی

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,397

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE13_181

تاریخ نمایه سازی: 27 آبان 1386

چکیده مقاله:

در سالهای اخیر تلاشهایی در جهت محاسبه معیا رهای اطمینان برای کلمات خروجی سیستم های بازشناسی گفتار انجام شده است . این معیارها می توانند جدا از مدلهای زبانی رایج که در سیستم های بازشناس به کار می روند، با استفاده از اطلاعا ت زبانی دیگر همانند اطلاعات معنایی به بهبود عملکرد این سیستم هاکمک کنند . در این مقاله از روش« آنالیز معنایی پنهان » یا 1 LSA برای استخراج یک معیار اطمینان که گویای میزان » شباهت معنایی « میان کلمات زبان فارسی است ، استفاده می شود . لازمه انجام این کار دسترسی ب ه بیان برداری هر یک از کلمات وا ژگان مورد بررسی می باشد . در این مقاله 2000 متن فارسی برداشته شده از مقالات روزنامه ها، از نظر تعداد تکرار وا ژگان در این متون مورد بررسی قرار گرفته، یک ماتریس بسیار بزرگ و تُنُک 2 از این تعداد تکرار تهی ه شده است . سپس با استفا ده از تکنیک SVD 3 یا » تجزیه به مقادیر تکین « ، یک ماتریس دیگر که شامل بیانهای برداری کلمات وا ژگان می باشد از تجزیه این ماتریس به دست می آید و » میزان شباهت معنایی « که به صورت کسینوس زاویه بین بردارها تعریف شده است، برای همه کلمات محاسبه می گردد ( ماتریسشباهت ). معیار اطمینان مستقیماً با استفاده از این ماتریس استخراج می گردد . برای آ زمایش مفید بودن استفاده از این معیار در بازشناسی گفتار ، از معیار مذکور در سیستم بازشناسی گفتار پیوستۀ فارسی » شنوا « به طور محدود شده استفاده گردید و برای یک مجموعۀ تست 26 جمله ای از جملا ت فارسی، % 2/5 کاهش نرخ خطای بازشناسی کلمات به دست آمد .

کلیدواژه ها:

بازشناسی گفتار ، معیار اطمینان ، آنالیز معنایی پنهان ) ) LSA ، شباهت معنایی

نویسندگان

آزاده حاجی حسینی

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمن

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمن

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • الماس‌گنج، ف.، سیدصالحی، سنع.، بیجن‌خان، م.، ثامتی، ح. شیخ‌زادگانج، «شنوا-1، ...
  • Rosenfel, R., ،Two Decades of Statistical Language Modeling: Where do ...
  • Giachin, E., Baggia, P., Micca, G., *Language models for spontaneous ...
  • Cox, S., Dasmahapatra, S., «High-Level Approaches to Confidence Estimation in ...
  • Cox, S., Dasmahapatra, S., ، A _ _ antically-Based Confidence ...
  • Cox, S., Dasmahapatra, S., ،A High-Level Approach to Confidence Estimation ...
  • Jerome R. Bellegarda, .، A Multi-span Language Modeling Framework for ...
  • Zanjan, Iran, May 10-12, 2005. ...
  • نمایش کامل مراجع