بازشناسی حالات هیجانی ترکیبی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 631

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

PCCO01_163

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

بازشناسی هیجان گفتار یکی از مهمترین و پیچیدهترین مباحث روز دنیا در حوزه ارتباط انسان و ماشین است. اکثر تحقیقات انجام شده در زمینه بازشناسی گفتار هیجانی، مبتنی بر پردازش گفتار سیستم شنوایی انسان میباشد.اما تاکنون در مورد بازشناسی حالات هیجانی گفتار و حالات هیجانی ترکیبی گفتار تحقیقی صورت نگرفته است. هدف از این پژوهش، بررسی و بازشناسی حالات هیجانی ترکیبی گفتار با استفاده از دیتاست فارسی ساخته شده به نام MES-Dataset و مقایسه این دیتاست با سایر دیتاست های گفتار هیجانی استاندارد موجود مانند Persian ESD و دیتاست برلین میباشد. همچنین بمنطور محاسبه نرخ بازشناسی گفتار هیجانی از مدل یادگیری هیجانی مغز که الهام گرفته از سیستم لیمبیک مغز انسان است، استفاده شده است. ورودی مدل پیشنهادی دیتاست تولید شده از پنج حالت هیجانی ترکیبی است. سپس ویژگی های سیگنال های هیجانی از طریق ترکیب روش های ضرایب کاپسترال فرکانس مل و ویژگی های عروضی استخراج خواهند شد و تمامی ویژگی های استخراج شده بمنظور طبقه بندی وارد مدل BEL میشوند. در بخش نتایج، مدل پیشنهادی و دیتاست ایجاد شده در این مقاله با دیگر دیتاستهای موجود و مدل های رایج یادگیری ماشین مقایسه شده است. نتایج آزمایشات نشان میدهند که دیتاست MES-Dataset با مدل پیشنهادی کارایی بالاتری را جهت بازشناسی گفتار هیجانی دارد.

کلیدواژه ها:

گفتار هیجانی ، هیجان ترکیبی ، دیتاست گفتار هیجانی ترکیبی ، یادگیری هیجانی مغز

نویسندگان

محمد عباسی

کارشناسی ارشد مهندسی کامپیوترگرایش نرم افزار، دانشگاه آزاد اسلامی فومن و شفت

سارا معتمد

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد فومن و شفت