مقایسه عملکرد الگوریتم رگرسیون بردار پشتیبان و فرایند گوسی در بازشناسی احساس از طریق گفتار در فضای پیوسته احساس
محل انتشار: اولین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 366
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CEITECH01_062
تاریخ نمایه سازی: 17 آبان 1396
چکیده مقاله:
بازشناسی احساس از طریق گفتار، موضوعی میان رشته ای در حوزه ی روانشناسی، بازشناسی الگو و پردازشسیگنال می باشد که در دهه ی اخیر، توجه بسیاری از پژوهشگران را به خود جلب نموده است. در این تحقیق، پنج گروه ازویژگیهای مهم صوتی شامل ویژگی های عروضی LPC ،PLP ،MFCC و فرمنت ها جهت استخراج ویژگی، الگوریتم-های کاهش ویژگی SFS و SBS، جهت انتخاب بردار ویژگی بهینه و الگوریتم های رگرسیون بردار پشتیبان و فرایند، گوسی به منظور تخمین مولفه های احساسی گفتار شامل برانگیختگی، تسلط و جاذبه، در فضای پیوسته سه بعدی بااستفاده از پایگاه داده ی VAM، بکار گرفته شده است. بر اساس نتایج آزمایش ها، از بین پنج گروه ویژگی استفاده شده، بهترین نتایج با استفاده از ویژگی های عروضی حاصل شده است. اما برای ترکیب ویژگی های مختلف، نتیجه کاملا بستگیبه الگوریتم های رگرسیون و کاهش ویژگی دارد. بطوریکه بهترین نتایج مربوط به ترکیب همه ی ویژگی ها و با استفاده ازالگوریتم رگرسیون فرایند گوسی و کاهشی ویژگی SFS می باشد. در این شرایط، ضریب همبستگی برای سه مولفه احساسی جاذبه، برانگیختگی و تسلط بترتیب برابر 43%، 74% و 74% می باشد.
کلیدواژه ها:
بازشناسی احساس از طریق گفتار ، فضای پیوسته احساس ، پایگاه داده ی VAM ، ویژگی های عروضی و طیفی ، الگوریتم رگرسیونطیفی ، الگوریتم رگرسیون
نویسندگان
زری فاتح
دانشگاه آزاد اسلامی، واحد الکترونیکی، گروه فنی و مهندسی، تهران، ایران
محمد خیراندیش
دانشگاه آزاد اسلامی، واحد الکترونیکی، گروه فنی و مهندسی، تهران، ایران