Outlier detection in test samples and supervised training set selection

  • سال انتشار: 1400
  • محل انتشار: مجله آنالیز غیر خطی و کاربردها، دوره: 12، شماره: 1
  • کد COI اختصاصی: JR_IJNAA-12-1_054
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 122
دانلود فایل این مقاله

نویسندگان

- -

Department of Computer Engineering‎, ‎Babol Branch‎, ‎Islamic Azad University‎, ‎Babol‎, ‎Iran

- -

Department of Computer Engineering‎, ‎Sari Branch‎, ‎Islamic Azad University‎, ‎Sari‎, ‎Iran

- -

Department of Computer Engineering‎, ‎Sari Branch‎, ‎Islamic Azad University‎, ‎Sari‎, ‎Iran

چکیده

‎Outlier detection is a technique for recognizing samples out of the main population within a data set‎. ‎Outliers have negative impacts on classification‎. ‎The recognized outliers are deleted to improve the classification power generally‎. ‎This paper proposes a method for outlier detection in test samples besides a supervised training set selection‎. ‎Training set selection is done based on the intersection of three well known similarity measures namely‎, ‎jacquard‎, ‎cosine‎, ‎and dice‎. ‎Each test sample is evaluated against the selected training set for possible outlier detection‎. ‎The selected training set is used for a two-stage classification‎. ‎The accuracy of classifiers are increased after outlier deletion‎. ‎The majority voting function is used for further improvement of classifiers‎.

کلیدواژه ها

‎Outlier detection‎, ‎Training set selection‎, ‎Similarity measures‎

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.