Investigating Shallow and Deep Learning Techniques for Emotion Classification in Short Persian Texts
- سال انتشار: 1402
- محل انتشار: مجله هوش مصنوعی و داده کاوی، دوره: 11، شماره: 4
- کد COI اختصاصی: JR_JADM-11-4_008
- زبان مقاله: انگلیسی
- تعداد مشاهده: 146
نویسندگان
Department of Computer Engineering, University of Bojnord, Bojnord, Iran.
Department of Computer Engineering, University of Bojnord, Bojnord, Iran.
چکیده
The identification of emotions in short texts of low-resource languages poses a significant challenge, requiring specialized frameworks and computational intelligence techniques. This paper presents a comprehensive exploration of shallow and deep learning methods for emotion detection in short Persian texts. Shallow learning methods employ feature extraction and dimension reduction to enhance classification accuracy. On the other hand, deep learning methods utilize transfer learning and word embedding, particularly BERT, to achieve high classification accuracy. A Persian dataset called "ShortPersianEmo" is introduced to evaluate the proposed methods, comprising ۵۴۷۲ diverse short Persian texts labeled in five main emotion classes. The evaluation results demonstrate that transfer learning and BERT-based text embedding perform better in accurately classifying short Persian texts than alternative approaches. The dataset of this study ShortPersianEmo will be publicly available online at https://github.com/vkiani/ShortPersianEmo.کلیدواژه ها
Natural Language Processing, emotion classification, Persian text, emotion detection benchmark, deep learningاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.