Advancing Binary Imbalanced Classification: A Novel Hybrid SamplingApproach for Noise Reduction and Data Integrity

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 297

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DSAI01_001

تاریخ نمایه سازی: 4 تیر 1403

چکیده مقاله:

In machine learning, dealing with binary imbalanced data classification ischallenging due to unequal class sizes, leading to model bias. We propose a unique methodthat uses filtering, ADASYN oversampling, and ENN cleaning to balance data, improveminority class accuracy, and boost overall model performance, showing significantimprovements in AUC, F۱, and G-mean metrics.

نویسندگان

Zahra Arefzadeh

Faculty of Data Science and Intelligent Systems, Persian Gulf University, Bushehr, Iran

Erfan Dehghani

Faculty of Data Science and Intelligent Systems, Persian Gulf University, Bushehr, Iran

Mohammad Bozorgmehr

Faculty of Data Science and Intelligent Systems, Persian Gulf University, Bushehr, Iran