مدلسازی بازشناسی عواطف درگفتار فارسی با استفاده از روش های یادگیری ماشین

سال انتشار: 1395
محل انتشار: سومین کنفرانس بین المللی علوم و مهندسی
کد COI اختصاصی: ICESCON03_242
زبان مقاله: فارسی
تعداد مشاهده: 653

نویسندگان

دانشگاه علم وصنعت ایران، دانشکده مهندسی کامپیوتر

چکیده

در این مطالعه بازشناسی عواطف در صوت فارسی مورد بررسی قرار گرفته است. برچسبزنی به فایلهای صوتی با بیان عاطفی مشخص میتواند آغاز راه سیستمهای کامپیوتری با موتور عاطفی است. از سویدیگر لزوم ایجاد مدلهای بازشناسی عواطف در هر زبان به صورت مستقل وجود دارد. ما با استفاده ازمدلهای یادگیری ماشین و بررسی و مقایسه آن سعی در معرفی یک مدل جهت بارشناسی حالات عاطفی ترس، خشم، شادی، غم و انزجار با دقت بیشینه را داشتهایم. مدلهای ایجاد شده بر روی مجموعه داده فارسی ESD و جهت بررسی تعمیم پذیری نتایج با آزمون مدل بر روی مجموعه داده Berlin که به زبان آلمانی است آزمایش شده است. جهت مقایسه نتایج و اطمینان از صحت نتیجه گیری مجموعه داده با تعداد 75 فایل صوتی از دوازده نفر ایجاد شده است که نتایج نشان میدهد که مدل ایجاد شده با روش GMM و SVM که با استفاده از اطلاعات MFCC تولید شده است بیشترین دقت راداشته اند. از سوی دیگر ایجاد مدل تشخیص صدای مردانه/زنانه به عنوان یک پیش پردازش باعث افزایش دقت مدل کلی میگردد

کلیدواژه ها

بازشناسی عواطف، پردازش صوت، گفتار فارسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.