Imbalanced Data Classification Using Combination of Oversampling and Fuzzy Support Vector Machines

  • سال انتشار: 1402
  • محل انتشار: پنجمین کنفرانس بین المللی محاسبات نرم
  • کد COI اختصاصی: CSCG05_029
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 28
دانلود فایل این مقاله

نویسندگان

Mostafa Sabzekar

Assistant Professor, Department of Computer Engineering, Birjand University of Technology, Birjand, Iran;

Arash Deldari

Assistant Professor, Department of Computer Engineering, University of Torbat Heydarieh, Torbat Heydarieh, Iran;

چکیده

Classifying imbalanced data stands as a critical aspect in machine learning, posing substantial hurdles due to the uneven distribution of data. Diverse methods have emerged to address such challenges in data categorization. This study aims to alleviate data imbalances while leveraging Fuzzy Support Vector Machines (FSVM) to bolster resilience against noisy and outlier data in mining tasks. Initially, our approach involves preprocessing the data via the SMOTE algorithm to establish a balanced dataset. This algorithm synthesizes data for the minority class by considering the proximity of individual samples. Following this, we employ Fuzzy Support Vector Machines to classify the preprocessed data. Lastly, we introduce a novel membership function for FSVM. The UCI dataset serves as the testing ground. Comparative results showcase the proposed method's adeptness in effectively handling imbalanced data.

کلیدواژه ها

Imbalanced data, SMOTEalgorithm, fuzzy supportvector machines.

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.