Advancing Binary Imbalanced Classification: A Novel Hybrid SamplingApproach for Noise Reduction and Data Integrity

  • سال انتشار: 1403
  • محل انتشار: اولین کنفرانس بین المللی دوسالانه هوش مصنوعی و علوم داده
  • کد COI اختصاصی: DSAI01_001
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 349
دانلود فایل این مقاله

نویسندگان

Zahra Arefzadeh

Faculty of Data Science and Intelligent Systems, Persian Gulf University, Bushehr, Iran

Erfan Dehghani

Faculty of Data Science and Intelligent Systems, Persian Gulf University, Bushehr, Iran

Mohammad Bozorgmehr

Faculty of Data Science and Intelligent Systems, Persian Gulf University, Bushehr, Iran

چکیده

In machine learning, dealing with binary imbalanced data classification ischallenging due to unequal class sizes, leading to model bias. We propose a unique methodthat uses filtering, ADASYN oversampling, and ENN cleaning to balance data, improveminority class accuracy, and boost overall model performance, showing significantimprovements in AUC, F۱, and G-mean metrics.

کلیدواژه ها

Imbalanced learning, Sampling technique, Classification, ADASYN

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.