بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 795

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG01_082

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

افراد ناشنوا به علت نقص در شنوایی در گفتار نیز دچار ناتوانی و یا اختلال می باشند و با استفاده از زبان اشاره و لب خوانی به عنوان زبان گفتاری با جامعه ارتباط برقرار می کنند، همچنین عدم شنوایی این افراد باعث دشواری در یادگیری آنان می شود. تا کنون روش های متعددی برای شناسنده های گفتار پیشنهاد شده اند. آنچه اهمیت دارد استفاده از روش هایی است که ضمن دارا بودن دقت و سرعت، قابلیت بازشناسی گفتار بسیار متفاوت افراد ناشنوا و نا گویا را داشته باشد. در این مقاله با یررسی سیستم متداول بازشناسی گفتار با استفاده از ویژگی های MFCC و LPC ضمن ایجاد مدل گفتاری برای افراد ناشنوا و ناگویا، از شبکه های عصبی مصنوعی جهت هوشمند سازی سیستم مورد نظر بهره گرفته شده است. در این مقاله برای اولین بار جمع آوری پایگاه داده ای متشکل از 810 نمونه صدا از افراد ناشنوا و ناگویا صورت گرفته است. دقت کارکرد این سیستم با بهره گیری از تحلیل منحنی ROC برابر 99.7% می باشد و قابلیت طبقه بندی صدای افراد ناشنوا و ناگویا را دارد.

نویسندگان

مینا اسدی سنجانی

دانشکده فنی و مهندسی ، دانشگاه خوارزمی

سعید ستایشی

دانشکده مهندسی انرژی و فیزیک ، دانشگاه صنعتی امیرکبیر