مدلهای یادگیری ماشین برای رتبه بندی اعتباری با استفاده از جستوجوی شبکهای و متعادل سازی دادهها

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 24

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

MABECONF11_048

تاریخ نمایه سازی: 20 تیر 1404

چکیده مقاله:

در این پژوهش با هدف ارتقای دقت پیشبینی ریسک بازپرداخت وام، ۹ الگوریتم طبقه بندی شامل Logistic regression، Random forest، Decision Tree، KNN، SVM، AdaBoost، Gradient boosting، XGBoost و MLP روی مجموعه داده نامتعادل دارای ۹۵۷۸ رکورد ارزیابی شدند. پس از تقسیم ۸۹ به ۸۰ برای آموزش و آزمون، انجام پیش پردازش شامل جایگذاری مقادیر گمشده، استانداردسازی ویژگی ها و One-Hot-Encoding متغیرهای دسته ای دو فاز آزمایشی اجرا گردید: فاز اولیه بدون متعادل کردن کلاس ها و تنظیم پارامتر، فاز SMOTE به همراه جستوجوی شبکه های با معیار F۱ برای شناسایی مشتریان پرریسک. نتایج نشان دادند که در فاز اولیه دقت کلی مدل ها بین ۳۸% تا ۳۸% و معیارهای Recall و F۱ برای کلاس اقلیت کمتر از ۸۳% بود. با اعمال SMOTE و بهینه سازی مبتنی بر F۱-score، دقت کلی به میانگین ۴۸% کاهش یافت اما Recall و F۱ کلاس پرریسک بهطور چشمگیری بهبود یافت؛ به گونه ای که SVM بهترین توازن را با ۴۸% = Precision، ۹۹% = Recall و ۸۸% = F۱ ارائه کرد، در حالی که AdaBoost بیشترین ۴۳% = Recall را کسب نمود و LogisticRegression، RandomForest و AdaBoost هر یک ۸۸% = F۱ را به دست آوردند. یافته ها بیانگر اهمیت اولویت بندی معیار F۱ و استفاده از روش های متعادل کردن مانند SMOTE برای افزایش حساسیت مدل در شناسایی مشتریان پرریسک است.

نویسندگان

علیرضا سلیمانی

دانشجوی کارشناسی ارشد مهندسی مالی دانشگاه تربیت مدرس

محمدعلی رستگار

عضو هیات علمی دانشگاه تربیت مدرس