بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی

مینا اسدی سنجانی; سعید ستایشی

بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی

محل انتشار: نخستین کنفرانس ملی محاسبات نرم

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 795

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/656592

شناسه ملی سند علمی:

CSCG01_082

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

افراد ناشنوا به علت نقص در شنوایی در گفتار نیز دچار ناتوانی و یا اختلال می باشند و با استفاده از زبان اشاره و لب خوانی به عنوان زبان گفتاری با جامعه ارتباط برقرار می کنند، همچنین عدم شنوایی این افراد باعث دشواری در یادگیری آنان می شود. تا کنون روش های متعددی برای شناسنده های گفتار پیشنهاد شده اند. آنچه اهمیت دارد استفاده از روش هایی است که ضمن دارا بودن دقت و سرعت، قابلیت بازشناسی گفتار بسیار متفاوت افراد ناشنوا و نا گویا را داشته باشد. در این مقاله با یررسی سیستم متداول بازشناسی گفتار با استفاده از ویژگی های MFCC و LPC ضمن ایجاد مدل گفتاری برای افراد ناشنوا و ناگویا، از شبکه های عصبی مصنوعی جهت هوشمند سازی سیستم مورد نظر بهره گرفته شده است. در این مقاله برای اولین بار جمع آوری پایگاه داده ای متشکل از 810 نمونه صدا از افراد ناشنوا و ناگویا صورت گرفته است. دقت کارکرد این سیستم با بهره گیری از تحلیل منحنی ROC برابر 99.7% می باشد و قابلیت طبقه بندی صدای افراد ناشنوا و ناگویا را دارد.

کلیدواژه ها:

ناشنوایی ، ناگویایی ، پردازش گفتار ، مدل گفتار ، شبکه عصبی ، intelligent neural network deafness ، ، dumbness ، ، speech processing ، speech model

نویسندگان

مینا اسدی سنجانی

دانشکده فنی و مهندسی ، دانشگاه خوارزمی

سعید ستایشی

دانشکده مهندسی انرژی و فیزیک ، دانشگاه صنعتی امیرکبیر