مقایسه عملکرد الگوریتم رگرسیون بردار پشتیبان و فرایند گوسی در بازشناسی احساس از طریق گفتار در فضای پیوسته احساس

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 366

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITECH01_062

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

بازشناسی احساس از طریق گفتار، موضوعی میان رشته ای در حوزه ی روانشناسی، بازشناسی الگو و پردازشسیگنال می باشد که در دهه ی اخیر، توجه بسیاری از پژوهشگران را به خود جلب نموده است. در این تحقیق، پنج گروه ازویژگیهای مهم صوتی شامل ویژگی های عروضی LPC ،PLP ،MFCC و فرمنت ها جهت استخراج ویژگی، الگوریتم-های کاهش ویژگی SFS و SBS، جهت انتخاب بردار ویژگی بهینه و الگوریتم های رگرسیون بردار پشتیبان و فرایند، گوسی به منظور تخمین مولفه های احساسی گفتار شامل برانگیختگی، تسلط و جاذبه، در فضای پیوسته سه بعدی بااستفاده از پایگاه داده ی VAM، بکار گرفته شده است. بر اساس نتایج آزمایش ها، از بین پنج گروه ویژگی استفاده شده، بهترین نتایج با استفاده از ویژگی های عروضی حاصل شده است. اما برای ترکیب ویژگی های مختلف، نتیجه کاملا بستگیبه الگوریتم های رگرسیون و کاهش ویژگی دارد. بطوریکه بهترین نتایج مربوط به ترکیب همه ی ویژگی ها و با استفاده ازالگوریتم رگرسیون فرایند گوسی و کاهشی ویژگی SFS می باشد. در این شرایط، ضریب همبستگی برای سه مولفه احساسی جاذبه، برانگیختگی و تسلط بترتیب برابر 43%، 74% و 74% می باشد.

کلیدواژه ها:

بازشناسی احساس از طریق گفتار ، فضای پیوسته احساس ، پایگاه داده ی VAM ، ویژگی های عروضی و طیفی ، الگوریتم رگرسیونطیفی ، الگوریتم رگرسیون

نویسندگان

زری فاتح

دانشگاه آزاد اسلامی، واحد الکترونیکی، گروه فنی و مهندسی، تهران، ایران

محمد خیراندیش

دانشگاه آزاد اسلامی، واحد الکترونیکی، گروه فنی و مهندسی، تهران، ایران