Mushakkal: Detecting Arabic Clickbait Using CNN with Various Optimizers
- سال انتشار: 1403
- محل انتشار: فصلنامه مدیریت فناوری اطلاعات، دوره: 16، شماره: 4
- کد COI اختصاصی: JR_JITM-16-4_004
- زبان مقاله: انگلیسی
- تعداد مشاهده: 115
نویسندگان
Department of Information Technology, College of Computer, Qassim University, Buraydah, Saudi Arabia.
Department of Information Technology, College of Computer, Qassim University, Buraydah, Saudi Arabia.
Department of Information Technology and Communication, Security Forces Hospital, Dammam, Saudi Arabia.
Department of Information Technology, College of Computer, Qassim University, Saudi Arabia. Department of Computers and Control Engineering, Faculty of Engineering, Tanta University, Egypt.
چکیده
The term "clickbait" refers to content specifically designed to capture readers' attention, often through misleading headlines, leading to frustration among social media users. In this study, titled "Mushakkal," which translates to "variety" in Arabic, we utilized a Convolutional Neural Network (CNN)—a deep learning approach—to detect clickbait within an Arabic dataset. We compared three optimizers: RMSprop, Adam, and Adadelta, evaluating various parameter settings to determine the most effective combination for detecting clickbait in Arabic content. Our findings revealed that the CNN model performed best when both pre-processing and Word۲Vec techniques were applied. The Adam optimizer outperformed the others, achieving a Macro-F۱ score of ۷۷%. The RMSprop optimizer closely followed, attaining a Macro-F۱ score of ۷۶%. In contrast, Adadelta proved to be the least effective for classifying Arabic text.کلیدواژه ها
Clickbait Detection, Arabic Dataset, Arabic Clickbait Detection, Deep learning, Optimizers, CNNاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.