استخراج و استفاده از معیار اطمینان کلمات در بازشناسی گفتار پیوسته فارسی
محل انتشار: سیزدهمین کنفرانس مهندسی برق ایران
سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,508
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE13_181
تاریخ نمایه سازی: 27 آبان 1386
چکیده مقاله:
در سالهای اخیر تلاشهایی در جهت محاسبه معیا رهای اطمینان برای کلمات خروجی سیستم های بازشناسی گفتار انجام شده است . این معیارها می توانند جدا از مدلهای زبانی رایج که در
سیستم های بازشناس به کار می روند، با استفاده از اطلاعا ت زبانی دیگر همانند اطلاعات معنایی به بهبود عملکرد این سیستم هاکمک کنند . در این مقاله از روش« آنالیز معنایی پنهان » یا 1 LSA برای استخراج یک معیار اطمینان که گویای میزان » شباهت معنایی « میان کلمات زبان فارسی است ، استفاده می شود . لازمه انجام این کار دسترسی ب ه بیان برداری هر یک از کلمات وا ژگان مورد بررسی می باشد . در این مقاله 2000 متن فارسی برداشته شده از مقالات روزنامه ها، از نظر تعداد تکرار وا ژگان در این متون مورد بررسی قرار گرفته، یک ماتریس بسیار بزرگ و تُنُک 2 از این تعداد تکرار تهی ه شده است . سپس با استفا ده از تکنیک SVD 3 یا » تجزیه به مقادیر تکین « ، یک ماتریس دیگر که شامل بیانهای برداری کلمات وا ژگان می باشد از تجزیه این ماتریس به دست می آید و » میزان شباهت معنایی « که به صورت کسینوس زاویه بین بردارها تعریف شده است، برای همه کلمات محاسبه می گردد ( ماتریسشباهت ). معیار اطمینان مستقیماً با استفاده از این ماتریس استخراج می گردد . برای آ زمایش مفید بودن استفاده از این معیار در بازشناسی گفتار ، از معیار مذکور در سیستم بازشناسی گفتار پیوستۀ فارسی » شنوا « به طور محدود شده استفاده گردید و برای یک مجموعۀ تست 26 جمله ای از جملا ت فارسی، % 2/5 کاهش نرخ خطای بازشناسی کلمات به دست آمد .
کلیدواژه ها:
نویسندگان
آزاده حاجی حسینی
دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمن
فرشاد الماس گنج
دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمن
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :