بازشناسی حالات هیجانی ترکیبی
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 631
فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
PCCO01_163
تاریخ نمایه سازی: 26 مرداد 1397
چکیده مقاله:
بازشناسی هیجان گفتار یکی از مهمترین و پیچیدهترین مباحث روز دنیا در حوزه ارتباط انسان و ماشین است. اکثر تحقیقات انجام شده در زمینه بازشناسی گفتار هیجانی، مبتنی بر پردازش گفتار سیستم شنوایی انسان میباشد.اما تاکنون در مورد بازشناسی حالات هیجانی گفتار و حالات هیجانی ترکیبی گفتار تحقیقی صورت نگرفته است. هدف از این پژوهش، بررسی و بازشناسی حالات هیجانی ترکیبی گفتار با استفاده از دیتاست فارسی ساخته شده به نام MES-Dataset و مقایسه این دیتاست با سایر دیتاست های گفتار هیجانی استاندارد موجود مانند Persian ESD و دیتاست برلین میباشد. همچنین بمنطور محاسبه نرخ بازشناسی گفتار هیجانی از مدل یادگیری هیجانی مغز که الهام گرفته از سیستم لیمبیک مغز انسان است، استفاده شده است. ورودی مدل پیشنهادی دیتاست تولید شده از پنج حالت هیجانی ترکیبی است. سپس ویژگی های سیگنال های هیجانی از طریق ترکیب روش های ضرایب کاپسترال فرکانس مل و ویژگی های عروضی استخراج خواهند شد و تمامی ویژگی های استخراج شده بمنظور طبقه بندی وارد مدل BEL میشوند. در بخش نتایج، مدل پیشنهادی و دیتاست ایجاد شده در این مقاله با دیگر دیتاستهای موجود و مدل های رایج یادگیری ماشین مقایسه شده است. نتایج آزمایشات نشان میدهند که دیتاست MES-Dataset با مدل پیشنهادی کارایی بالاتری را جهت بازشناسی گفتار هیجانی دارد.
کلیدواژه ها:
نویسندگان
محمد عباسی
کارشناسی ارشد مهندسی کامپیوترگرایش نرم افزار، دانشگاه آزاد اسلامی فومن و شفت
سارا معتمد
گروه کامپیوتر، دانشگاه آزاد اسلامی واحد فومن و شفت