رویکرد نوین undersampling مبتنی بر چگالی برای متعادل سازی مجموعه داده های نامتعادل
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 530
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NREAS03_226
تاریخ نمایه سازی: 16 آبان 1400
چکیده مقاله:
در این مقاله یک الگوریتم با رویکرد undersampling برای مجموعه داده های نامتعادل ارائه شده است. مجموعه ای را نامتعادل گویند که تعداد نمونه های یک کلاس (کلاس اقلیت) نسبت به سایر کلاس ها کلاس اکثریت) خیلی کمتر باشد. کلاس اقلیت، کلاس مورد علاقه برای یادگیری می باشد. راه حل های سطح داده که به دو رویکرد کلی Oversampling و undersampling تقسیم می شوند، از راههای مقابله با عدم تعادل می باشند. الگوریتم پیشنهادی داده های موجود در مناطق پرچگال را با تبدیل به داده هایی جدید با تعداد کمتر، سبب کاهش داده در کلاس اکثریت و رسیدن به تعادل دلخواه میشود. برای ارزیابی پیشنهاد ارائه شده، الگوریتم پیشنهادی و ۶ روش مشهور را بر روی ۱۰ مجموعه داده با حجم و نرخ عدم تعادل متفاوت اجرا و توسط طبقه بند KNN ارزیابی می شوند. معیار ارزیابی مورد بررسی، sensitivy میباشد. الگوریتم پیشنهادی به نسبت دیگر الگوریتمها نتایج چشمگیری در این معیار ارزیابی داشته است.
کلیدواژه ها:
نویسندگان
سیما میابادی
دانشجوی کارشناسی ارشد، دانشگاه بیرجند.
حمید سعادت فر
استادیار، دانشگاه بیرجند.