بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی
محل انتشار: نخستین کنفرانس ملی محاسبات نرم
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 795
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSCG01_082
تاریخ نمایه سازی: 29 مهر 1396
چکیده مقاله:
افراد ناشنوا به علت نقص در شنوایی در گفتار نیز دچار ناتوانی و یا اختلال می باشند و با استفاده از زبان اشاره و لب خوانی به عنوان زبان گفتاری با جامعه ارتباط برقرار می کنند، همچنین عدم شنوایی این افراد باعث دشواری در یادگیری آنان می شود. تا کنون روش های متعددی برای شناسنده های گفتار پیشنهاد شده اند. آنچه اهمیت دارد استفاده از روش هایی است که ضمن دارا بودن دقت و سرعت، قابلیت بازشناسی گفتار بسیار متفاوت افراد ناشنوا و نا گویا را داشته باشد. در این مقاله با یررسی سیستم متداول بازشناسی گفتار با استفاده از ویژگی های MFCC و LPC ضمن ایجاد مدل گفتاری برای افراد ناشنوا و ناگویا، از شبکه های عصبی مصنوعی جهت هوشمند سازی سیستم مورد نظر بهره گرفته شده است. در این مقاله برای اولین بار جمع آوری پایگاه داده ای متشکل از 810 نمونه صدا از افراد ناشنوا و ناگویا صورت گرفته است. دقت کارکرد این سیستم با بهره گیری از تحلیل منحنی ROC برابر 99.7% می باشد و قابلیت طبقه بندی صدای افراد ناشنوا و ناگویا را دارد.
کلیدواژه ها:
ناشنوایی ، ناگویایی ، پردازش گفتار ، مدل گفتار ، شبکه عصبی ، intelligent neural network deafness ، ، dumbness ، ، speech processing ، speech model
نویسندگان
مینا اسدی سنجانی
دانشکده فنی و مهندسی ، دانشگاه خوارزمی
سعید ستایشی
دانشکده مهندسی انرژی و فیزیک ، دانشگاه صنعتی امیرکبیر