Emotion Recognition for Persian Speech Using Convolutional Neural Network and Support Vector Machine

  • سال انتشار: 1402
  • محل انتشار: مجله کنترل و بهینه سازی در ریاضیات کاربردی، دوره: 8، شماره: 2
  • کد COI اختصاصی: JR_COAM-8-2_006
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 195
دانلود فایل این مقاله

نویسندگان

Saeed Hashemi

‎Department of Computer Engineering and Information Technology‎, ‎Payame Noor University (PNU)‎, ‎Tehran‎, ‎Iran

Saeed Ayat

‎Department of Computer Engineering and Information Technology‎, ‎Payame Noor University (PNU)‎, ‎Tehran‎, ‎Iran

چکیده

The paper discusses the limitations of emotion recognition in Persian speech due to inefficient feature extraction and classification tools‎. ‎To address this‎, ‎we propose a new method for detecting hidden emotions in Persian speech with higher recognition accuracy‎. ‎The method involves four steps‎: ‎preprocessing‎, ‎feature description‎, ‎feature extraction‎, ‎and classification‎. ‎The input signal is normalized in the preprocessing step using single-channel vector conversion and signal resampling‎. ‎Feature descriptions are performed using Mel-Frequency Cepstral Coefficients and Spectro-Temporal Modulation techniques‎, ‎which produce separate feature matrices‎. ‎These matrices are then merged and used for feature extraction through a Convolutional Neural Network‎. ‎Finally‎, ‎a Support Vector Machine with a linear kernel function is used for emotion classification‎. ‎The proposed method is evaluated using the Sharif Emotional Speech dataset and achieves an average accuracy of ۸۰.۹% in classifying emotions in Persian speech‎.

کلیدواژه ها

Emotion recognition in speech‎, ‎Mel-Frequency cepstral coefficients‎, ‎Convolutional neural network‎, ‎Support vector machine

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.