رویکرد نوین undersampling مبتنی بر چگالی برای متعادل سازی مجموعه داده های نامتعادل
- سال انتشار: 1400
- محل انتشار: سومین کنفرانس ملی پژوهش های نوین در مهندسی و علوم کاربردی
- کد COI اختصاصی: NREAS03_226
- زبان مقاله: فارسی
- تعداد مشاهده: 532
نویسندگان
دانشجوی کارشناسی ارشد، دانشگاه بیرجند.
استادیار، دانشگاه بیرجند.
چکیده
در این مقاله یک الگوریتم با رویکرد undersampling برای مجموعه داده های نامتعادل ارائه شده است. مجموعه ای را نامتعادل گویند که تعداد نمونه های یک کلاس (کلاس اقلیت) نسبت به سایر کلاس ها کلاس اکثریت) خیلی کمتر باشد. کلاس اقلیت، کلاس مورد علاقه برای یادگیری می باشد. راه حل های سطح داده که به دو رویکرد کلی Oversampling و undersampling تقسیم می شوند، از راههای مقابله با عدم تعادل می باشند. الگوریتم پیشنهادی داده های موجود در مناطق پرچگال را با تبدیل به داده هایی جدید با تعداد کمتر، سبب کاهش داده در کلاس اکثریت و رسیدن به تعادل دلخواه میشود. برای ارزیابی پیشنهاد ارائه شده، الگوریتم پیشنهادی و ۶ روش مشهور را بر روی ۱۰ مجموعه داده با حجم و نرخ عدم تعادل متفاوت اجرا و توسط طبقه بند KNN ارزیابی می شوند. معیار ارزیابی مورد بررسی، sensitivy میباشد. الگوریتم پیشنهادی به نسبت دیگر الگوریتمها نتایج چشمگیری در این معیار ارزیابی داشته است.کلیدواژه ها
مجموعه داده نامتعادل، undersampling، چگالی.مقالات مرتبط جدید
- Resource Optimization in Large Language Model Deployment Using Reinforcement Learning and Adaptive Software Engineering
- کاربرد یادگیری ماشین در پیشبینی خطاهای نرم افزاری در مراحل اولیه توسعه سیستم های پیچیده
- A review of the application of silver nanoparticles in improving the performance of ultrathin silicon solar cells
- نگرشی برنانو و نقش آن در تصفیه آب در نیروگاه های برق
- The Biomechanical Effect of Knee Flexion Angles on Squat Lifting with a Flat Back Position
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.