مدل سازی و پیشبینی رخدادهای نامتوازن با بهره گیری از یادگیری ترکیبی XGBoost و ADASYN

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 68

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSIEM04_192

تاریخ نمایه سازی: 17 خرداد 1405

چکیده مقاله:

در بسیاری از حوزه های تصمیم گیری داده ها به صورت نامتوازن توزیع شده اند؛ به گونه ای که وقوع برخی رخدادها بسیار کمتر از سایرین مشاهده می شود. این عدم توازن باعث کاهش کارایی روش های کلاسیک یادگیری ماشین در پیش بینی رخدادهای کم تکرار می شود. در پژوهش حاضر، یک رویکرد ترکیبی مبتنی بر الگوریتم XGBoost همراه با روش نمونه برداری بیش از حد تطبیقی ADASYN ارائه شده است تا عملکرد مدل در مواجهه با داده های نامتوازن بهبود یابد. پس از اعمال ADASYN برای ایجاد تعادل در داده ها، مدل های Random Forest، XGBoost و Logistic Regression با استفاده از جستجوی شبکه ای تصادفی (Randomized SearchCV) بهینه سازی شدند. نتایج نشان داد که مدل XGBoost با دقت ۷۷.۰۸٪ و مدل های Random Forest و Logistic Regression هر دو با دقت ۷۹.۸۶٪ عملکرد مطلوبی داشتند. شاخص های Recall، Precision و F۱-Score برای کلاس های کم تعداد و Cross-Validation نیز بیانگر عملکرد مناسب مدل ها در تشخیص رخدادهای نادر هستند. تحلیل نمودارهای ROC و Precision-Recall نشان داد که ترکیب ADASYN با الگوریتم های یادگیری ماشین می تواند دقت پیش بینی رخدادهای نامتوازن را بهبود دهد و ابزار موثری برای تصمیم گیری در پروژه ها فراهم کند.

نویسندگان

سام حیدری

استادیار، گروه مهندسی صنایع دانشکده فنی و مهندسی دانشگاه خوارزمی، تهران، ایران

مسعود صادقی

کارشناسی ارشد گروه مهندسی صنایع دانشکده فنی و مهندسی دانشگاه خوارزمی، تهران، ایران

اشکان مزدگیر

دانشجوی کارشناسی ارشد گروه مدیریت دانشکده اقتصاد دانشگاه سمنان، سمنان، ایران