تشخیص و طبقه بندی گفتار افراد از طریق متدهای پردازش گفتار و شبکه های عصبی مصنوعی چند لایه پرسپترون پیشخور

  • سال انتشار: 1399
  • محل انتشار: پنجمین کنفرانس ملی محاسبات نرم در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: SCECE05_052
  • زبان مقاله: فارسی
  • تعداد مشاهده: 779
دانلود فایل این مقاله

نویسندگان

مسلم ساجد

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

سجاد جهانبخش

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

عباس میرزایی ثمرین

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

چکیده

سیگنال گفتار یکی از طبیعی ترین و سریع ترین روش های ارتباط مابین افراد است. بسیاری از سیستم ها توسط محققین مختلف طراحی شده اند تا حالات های مختلف گفتاری را از سیگنال گفتار شناسایی کنند. در تشخیص و بازشناسی گفتار، ویژگی هایی مانند زیر و بمی، انرژی و غیره استفاده می شود. در این تحقیق، بازشناسی برای حالت های مختلف گفتار اعم از غم، خنثی بودن، شاد بودن، تعجب و عصبانیت و.... به کار گرفته شده است. ورودی سیستم مورد نظر، شامل نمونه گفتار از 5 مرد و 5 زن می باشد که 10 جمله مختلف از 7 نوع حالت گفتاری احساساتی شامل حالت های(عصبانیت، کسالت، انزجار، ترس، خوشبختی، غم و اندوه و بی طرف) است. ویژگی های مختلف گفتاری از طریق MFCC استخراج و وارد شبکه عصبی پرسپترون چند لایه پیشخور شد که دقت بالایی را در طبقه بندی و بازشناسی انواع حالت های گفتاری را نشان می دهد.

کلیدواژه ها

پردازش گفتار، استخراج ویژگیها، ضرایب کپسترال فرکانس مل، شبکه عصبی پرسپترون چند لایه پیشخور

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.