Outlier detection in test samples and supervised training set selection
- سال انتشار: 1400
- محل انتشار: مجله آنالیز غیر خطی و کاربردها، دوره: 12، شماره: 1
- کد COI اختصاصی: JR_IJNAA-12-1_054
- زبان مقاله: انگلیسی
- تعداد مشاهده: 122
نویسندگان
Department of Computer Engineering, Babol Branch, Islamic Azad University, Babol, Iran
Department of Computer Engineering, Sari Branch, Islamic Azad University, Sari, Iran
Department of Computer Engineering, Sari Branch, Islamic Azad University, Sari, Iran
چکیده
Outlier detection is a technique for recognizing samples out of the main population within a data set. Outliers have negative impacts on classification. The recognized outliers are deleted to improve the classification power generally. This paper proposes a method for outlier detection in test samples besides a supervised training set selection. Training set selection is done based on the intersection of three well known similarity measures namely, jacquard, cosine, and dice. Each test sample is evaluated against the selected training set for possible outlier detection. The selected training set is used for a two-stage classification. The accuracy of classifiers are increased after outlier deletion. The majority voting function is used for further improvement of classifiers.کلیدواژه ها
Outlier detection, Training set selection, Similarity measuresاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.