Emotion Recognition for Persian Speech Using Convolutional Neural Network and Support Vector Machine
- سال انتشار: 1402
- محل انتشار: مجله کنترل و بهینه سازی در ریاضیات کاربردی، دوره: 8، شماره: 2
- کد COI اختصاصی: JR_COAM-8-2_006
- زبان مقاله: انگلیسی
- تعداد مشاهده: 195
نویسندگان
Department of Computer Engineering and Information Technology, Payame Noor University (PNU), Tehran, Iran
Department of Computer Engineering and Information Technology, Payame Noor University (PNU), Tehran, Iran
چکیده
The paper discusses the limitations of emotion recognition in Persian speech due to inefficient feature extraction and classification tools. To address this, we propose a new method for detecting hidden emotions in Persian speech with higher recognition accuracy. The method involves four steps: preprocessing, feature description, feature extraction, and classification. The input signal is normalized in the preprocessing step using single-channel vector conversion and signal resampling. Feature descriptions are performed using Mel-Frequency Cepstral Coefficients and Spectro-Temporal Modulation techniques, which produce separate feature matrices. These matrices are then merged and used for feature extraction through a Convolutional Neural Network. Finally, a Support Vector Machine with a linear kernel function is used for emotion classification. The proposed method is evaluated using the Sharif Emotional Speech dataset and achieves an average accuracy of ۸۰.۹% in classifying emotions in Persian speech.کلیدواژه ها
Emotion recognition in speech, Mel-Frequency cepstral coefficients, Convolutional neural network, Support vector machineاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.