Classification of Persian News Articles using Machine Learning Techniques
محل انتشار: مجله مهندسی کامپیوتر و دانش، دوره: 4، شماره: 1
سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 232
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_CKE-4-1_001
تاریخ نمایه سازی: 25 خرداد 1401
چکیده مقاله:
Automatic text classification, which is defined as the process of automatically classifying texts into predefined categories, has many applications in our everyday life and it has recently gained much attention due to the in-creased number of text documents available in electronic form. Classifying News articles is one of the applications of text classification. Automatic classification is a subset of machine learning techniques in which a classifier is built by learning from some pre-classified documents. Naïve Bayes and k-Nearest Neighbor are among the most common algorithms of machine learning for text classification. In this paper, we suggest a way to improve the performance of a text classifier using Mutual information and Chi-square feature selection algorithms. We have observed that MI feature selection method can improve the accuracy of Naïve Bayes classifier up to ۱۰%. Experimental results show that the proposed model achieves an average accuracy of ۸۰% and an average F۱-measure of ۸۰%.
کلیدواژه ها:
Automatic Persian text classification ، k-Nearest Neighbor ، Naïve Bayes ، News text classification ، Text mining
نویسندگان
Sareh Mostafavi
Department of Computational Linguistics, Regional Information Center for Science and Technology (RICeST), Shiraz, Fars, Iran
Bahareh Pahlevanzadeh
Department of Design and System Operations, Regional Information Center for Science and Technology (RICeST), Shiraz, Fars, Iran
Mohammad Reza Falahati Qadimi Fumani
Department of Computational Linguistics, Regional Information Center for Science and Technology (RICeST), Shiraz, Fars, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :