تشخیص و طبقه بندی گفتار افراد از طریق متدهای پردازش گفتار و شبکه های عصبی مصنوعی چند لایه پرسپترون پیشخور
- سال انتشار: 1399
- محل انتشار: پنجمین کنفرانس ملی محاسبات نرم در مهندسی برق و کامپیوتر
- کد COI اختصاصی: SCECE05_052
- زبان مقاله: فارسی
- تعداد مشاهده: 779
نویسندگان
گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران
گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران
گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران
چکیده
سیگنال گفتار یکی از طبیعی ترین و سریع ترین روش های ارتباط مابین افراد است. بسیاری از سیستم ها توسط محققین مختلف طراحی شده اند تا حالات های مختلف گفتاری را از سیگنال گفتار شناسایی کنند. در تشخیص و بازشناسی گفتار، ویژگی هایی مانند زیر و بمی، انرژی و غیره استفاده می شود. در این تحقیق، بازشناسی برای حالت های مختلف گفتار اعم از غم، خنثی بودن، شاد بودن، تعجب و عصبانیت و.... به کار گرفته شده است. ورودی سیستم مورد نظر، شامل نمونه گفتار از 5 مرد و 5 زن می باشد که 10 جمله مختلف از 7 نوع حالت گفتاری احساساتی شامل حالت های(عصبانیت، کسالت، انزجار، ترس، خوشبختی، غم و اندوه و بی طرف) است. ویژگی های مختلف گفتاری از طریق MFCC استخراج و وارد شبکه عصبی پرسپترون چند لایه پیشخور شد که دقت بالایی را در طبقه بندی و بازشناسی انواع حالت های گفتاری را نشان می دهد.کلیدواژه ها
پردازش گفتار، استخراج ویژگیها، ضرایب کپسترال فرکانس مل، شبکه عصبی پرسپترون چند لایه پیشخورمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.