Feature selection based on hybridization of Information gain and graph clustering for text classification
- سال انتشار: 1398
- محل انتشار: دهمین کنفرانس فناوری اطلاعات و دانشIKT2019
- کد COI اختصاصی: ICIKT10_053
- زبان مقاله: انگلیسی
- تعداد مشاهده: 655
نویسندگان
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
Department of Computer Engineering, University of Kurdistan, Sanandaj, Iran
چکیده
Text datasets usually have a lot of features. Therefore, theirs classification cost is too much and feature selection in this context is of vital importance. In this paper, a novel feature selection method based on information gain and FAST algorithm is proposed. In the proposed method, at first, the features with higher information gain are selected. Then, the FAST algorithm on the selected features is applied. Experiments are carried out to compare our algorithm with several feature selection techniques. The new approach is tested on three text datasets. The results confirm that the proposed method produces smaller feature subset in shorter time. The evaluation of a K-nearest neighborhood classifier on validation data show that, the novel algorithm gives higher classification accuracy.کلیدواژه ها
مقالات مرتبط جدید
- راهکارهای بومی معمارانه ، پاسخی برای مسکن مقرون به صرفه (روستاهای سرد و کوهستانی )
- Considering the Digital Twin as the Evolved Level ofBIM in the Context of Construction ۴.۰
- مروری بر مبانی و مفاهیم نظری در خصوص بررسی عوامل کالبدی سرای سالمندان و سلامت روان آنها با تاکید بر توسعه پایدار(مطالعه موردی : شهر شیراز)
- مروری بر انواع طاقچه های نوری تلفیقی
- مروری بر سیستم های انتقال نور روز با تاکید بر چاههای نوری در ساختمان
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.