ارایه روشی جهت بازشناسی گفتار با استفاده از شبکه های عصبی مصنوعی پس انتشار

  • سال انتشار: 1396
  • محل انتشار: دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCOMP02_339
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1440
دانلود فایل این مقاله

نویسندگان

رضا بهرامی راد

فارغ التحصیل رشته مهندسی کامپیوتر، دانشگاه خوارزمی، تهران، ایران

چکیده

رابط گفتار برای کامپیوتر، یک تکنولوژی عمومی برای کاربران است. برنامه های کاربردی متعددی جهت تشخیص خودکار گفتار در سیستم هواپیمایی، ورود داده ها، پردازش متن، رابط های شماره گیری صوتی و حوزه های مختلف صنعتی استفاده می شود. پردازش گفتار می تواند یک رابط مفید برای تعامل با ماشین باشد. در واقع تشخیص گفتار یک پدیده ذهنی است و در این حوزه تحقیقات زیادی صورت گرفته است. سیستم های تشخیص گفتار به دو بخش مختلف یعنی استخراج ویژگی ها و تشخیص ویژگی ها تقسیم می شود. در این تحقیق صدای افراد با سنین مختلف در یک محیط آرام و بدون نویز از طریق میکروفون ضبط شده است. افراد به طور یکسان 10 الی 12 ثانیه صحبت کرده اند. سپس جملات گفتاری با فرمت wave ذخیره شده است. برای استخراج ویژگی ها از ضرایب کپسترال فرکانس مل (MFCC) و از شبکه عصبی پس انتشار برای آموزش، تشخیص و طبقه بندی استفاده شده است

کلیدواژه ها

تشخیص گفتار، شبکه های عصبی مصنوعی پس انتشار، MFCC، طبقه بندی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.