CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی

عنوان مقاله: بررسی مدل گفتاری افراد ناشنوا و ناگویا و طبقه بندی آن با استفاده از شبکه عصبی
شناسه ملی مقاله: CSCG01_082
منتشر شده در نخستین کنفرانس ملی محاسبات نرم در سال 1394
مشخصات نویسندگان مقاله:

مینا اسدی سنجانی - دانشکده فنی و مهندسی ، دانشگاه خوارزمی
سعید ستایشی - دانشکده مهندسی انرژی و فیزیک ، دانشگاه صنعتی امیرکبیر

خلاصه مقاله:
افراد ناشنوا به علت نقص در شنوایی در گفتار نیز دچار ناتوانی و یا اختلال می باشند و با استفاده از زبان اشاره و لب خوانی به عنوان زبان گفتاری با جامعه ارتباط برقرار می کنند، همچنین عدم شنوایی این افراد باعث دشواری در یادگیری آنان می شود. تا کنون روش های متعددی برای شناسنده های گفتار پیشنهاد شده اند. آنچه اهمیت دارد استفاده از روش هایی است که ضمن دارا بودن دقت و سرعت، قابلیت بازشناسی گفتار بسیار متفاوت افراد ناشنوا و نا گویا را داشته باشد. در این مقاله با یررسی سیستم متداول بازشناسی گفتار با استفاده از ویژگی های MFCC و LPC ضمن ایجاد مدل گفتاری برای افراد ناشنوا و ناگویا، از شبکه های عصبی مصنوعی جهت هوشمند سازی سیستم مورد نظر بهره گرفته شده است. در این مقاله برای اولین بار جمع آوری پایگاه داده ای متشکل از 810 نمونه صدا از افراد ناشنوا و ناگویا صورت گرفته است. دقت کارکرد این سیستم با بهره گیری از تحلیل منحنی ROC برابر 99.7% می باشد و قابلیت طبقه بندی صدای افراد ناشنوا و ناگویا را دارد.

کلمات کلیدی:
ناشنوایی، ناگویایی، پردازش گفتار، مدل گفتار، شبکه عصبی ، intelligent neural network deafness,، dumbness,، speech processing، speech model

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/656592/