تشخیص و طبقه بندی گفتار افراد از طریق متدهای پردازش گفتار و شبکه های عصبی مصنوعی چند لایه پرسپترون پیشخور

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 357

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SCECE05_052

تاریخ نمایه سازی: 25 دی 1399

چکیده مقاله:

سیگنال گفتار یکی از طبیعی ترین و سریع ترین روش های ارتباط مابین افراد است. بسیاری از سیستم ها توسط محققین مختلف طراحی شده اند تا حالات های مختلف گفتاری را از سیگنال گفتار شناسایی کنند. در تشخیص و بازشناسی گفتار، ویژگی هایی مانند زیر و بمی، انرژی و غیره استفاده می شود. در این تحقیق، بازشناسی برای حالت های مختلف گفتار اعم از غم، خنثی بودن، شاد بودن، تعجب و عصبانیت و.... به کار گرفته شده است. ورودی سیستم مورد نظر، شامل نمونه گفتار از 5 مرد و 5 زن می باشد که 10 جمله مختلف از 7 نوع حالت گفتاری احساساتی شامل حالت های(عصبانیت، کسالت، انزجار، ترس، خوشبختی، غم و اندوه و بی طرف) است. ویژگی های مختلف گفتاری از طریق MFCC استخراج و وارد شبکه عصبی پرسپترون چند لایه پیشخور شد که دقت بالایی را در طبقه بندی و بازشناسی انواع حالت های گفتاری را نشان می دهد.

کلیدواژه ها:

پردازش گفتار ، استخراج ویژگیها ، ضرایب کپسترال فرکانس مل ، شبکه عصبی پرسپترون چند لایه پیشخور

نویسندگان

مسلم ساجد

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

سجاد جهانبخش

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

عباس میرزایی ثمرین

گروه مهندسی کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران