استخراج و استفاده از معیار اطمینان کلمات در بازشناسی گفتار پیوسته فارسی

آزاده حاجی حسینی; فرشاد الماس گنج

استخراج و استفاده از معیار اطمینان کلمات در بازشناسی گفتار پیوسته فارسی

محل انتشار: سیزدهمین کنفرانس مهندسی برق ایران

سال انتشار: 1384

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,508

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/42057

شناسه ملی سند علمی:

ICEE13_181

تاریخ نمایه سازی: 27 آبان 1386

چکیده مقاله:

در سالهای اخیر تلاشهایی در جهت محاسبه معیا رهای اطمینان برای کلمات خروجی سیستم های بازشناسی گفتار انجام شده است . این معیارها می توانند جدا از مدلهای زبانی رایج که در سیستم های بازشناس به کار می روند، با استفاده از اطلاعا ت زبانی دیگر همانند اطلاعات معنایی به بهبود عملکرد این سیستم هاکمک کنند . در این مقاله از روش« آنالیز معنایی پنهان » یا 1 LSA برای استخراج یک معیار اطمینان که گویای میزان » شباهت معنایی « میان کلمات زبان فارسی است ، استفاده می شود . لازمه انجام این کار دسترسی ب ه بیان برداری هر یک از کلمات وا ژگان مورد بررسی می باشد . در این مقاله 2000 متن فارسی برداشته شده از مقالات روزنامه ها، از نظر تعداد تکرار وا ژگان در این متون مورد بررسی قرار گرفته، یک ماتریس بسیار بزرگ و تُنُک 2 از این تعداد تکرار تهی ه شده است . سپس با استفا ده از تکنیک SVD 3 یا » تجزیه به مقادیر تکین « ، یک ماتریس دیگر که شامل بیانهای برداری کلمات وا ژگان می باشد از تجزیه این ماتریس به دست می آید و » میزان شباهت معنایی « که به صورت کسینوس زاویه بین بردارها تعریف شده است، برای همه کلمات محاسبه می گردد ( ماتریسشباهت ). معیار اطمینان مستقیماً با استفاده از این ماتریس استخراج می گردد . برای آ زمایش مفید بودن استفاده از این معیار در بازشناسی گفتار ، از معیار مذکور در سیستم بازشناسی گفتار پیوستۀ فارسی » شنوا « به طور محدود شده استفاده گردید و برای یک مجموعۀ تست 26 جمله ای از جملا ت فارسی، % 2/5 کاهش نرخ خطای بازشناسی کلمات به دست آمد .

کلیدواژه ها:

بازشناسی گفتار ، معیار اطمینان ، آنالیز معنایی پنهان ) ) LSA ، شباهت معنایی

نویسندگان

آزاده حاجی حسینی

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمن

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمن

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

الماس‌گنج، ف.، سیدصالحی، سنع.، بیجن‌خان، م.، ثامتی، ح. شیخ‌زادگانج، «شنوا-1، ...
Rosenfel, R., ،Two Decades of Statistical Language Modeling: Where do ...
Giachin, E., Baggia, P., Micca, G., *Language models for spontaneous ...
Cox, S., Dasmahapatra, S., «High-Level Approaches to Confidence Estimation in ...
Cox, S., Dasmahapatra, S., ، A _ _ antically-Based Confidence ...
Cox, S., Dasmahapatra, S., ،A High-Level Approach to Confidence Estimation ...
Jerome R. Bellegarda, .، A Multi-span Language Modeling Framework for ...
Zanjan, Iran, May 10-12, 2005. ...

نمایش کامل مراجع