مدلهای یادگیری ماشین برای رتبه بندی اعتباری با استفاده از جستوجوی شبکهای و متعادل سازی دادهها
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 24
فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
MABECONF11_048
تاریخ نمایه سازی: 20 تیر 1404
چکیده مقاله:
در این پژوهش با هدف ارتقای دقت پیشبینی ریسک بازپرداخت وام، ۹ الگوریتم طبقه بندی شامل Logistic regression، Random forest، Decision Tree، KNN، SVM، AdaBoost، Gradient boosting، XGBoost و MLP روی مجموعه داده نامتعادل دارای ۹۵۷۸ رکورد ارزیابی شدند. پس از تقسیم ۸۹ به ۸۰ برای آموزش و آزمون، انجام پیش پردازش شامل جایگذاری مقادیر گمشده، استانداردسازی ویژگی ها و One-Hot-Encoding متغیرهای دسته ای دو فاز آزمایشی اجرا گردید: فاز اولیه بدون متعادل کردن کلاس ها و تنظیم پارامتر، فاز SMOTE به همراه جستوجوی شبکه های با معیار F۱ برای شناسایی مشتریان پرریسک. نتایج نشان دادند که در فاز اولیه دقت کلی مدل ها بین ۳۸% تا ۳۸% و معیارهای Recall و F۱ برای کلاس اقلیت کمتر از ۸۳% بود. با اعمال SMOTE و بهینه سازی مبتنی بر F۱-score، دقت کلی به میانگین ۴۸% کاهش یافت اما Recall و F۱ کلاس پرریسک بهطور چشمگیری بهبود یافت؛ به گونه ای که SVM بهترین توازن را با ۴۸% = Precision، ۹۹% = Recall و ۸۸% = F۱ ارائه کرد، در حالی که AdaBoost بیشترین ۴۳% = Recall را کسب نمود و LogisticRegression، RandomForest و AdaBoost هر یک ۸۸% = F۱ را به دست آوردند. یافته ها بیانگر اهمیت اولویت بندی معیار F۱ و استفاده از روش های متعادل کردن مانند SMOTE برای افزایش حساسیت مدل در شناسایی مشتریان پرریسک است.
کلیدواژه ها:
نویسندگان
علیرضا سلیمانی
دانشجوی کارشناسی ارشد مهندسی مالی دانشگاه تربیت مدرس
محمدعلی رستگار
عضو هیات علمی دانشگاه تربیت مدرس