امتیازدهی اعتباری مشتریان با استفاده از الگوریتم RUSBoost توسعه یافته و توصیف گرداده ی مبتنی بر بردارپشتیبان با گام برداری تصادفی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 762

فایل این مقاله در 32 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC03_081

تاریخ نمایه سازی: 6 اردیبهشت 1396

چکیده مقاله:

امتیازدهی اعتباری مشتریان یکی از ابزارهای مدیریت ریسک در سیستم های بانکی است. طراحی طبقه بندهایی که بتوانندشناسایی بهتر مشتریان بانکی را به درستی انجام دهند به عنوان یکی از چالش های اساسی در داده کاوی و یادگیری ماشین،مورد مطالعه ی بسیاری از محققان قرار گرفته است. در سال های اخیر در میان تحقیقات ارزشمند انجام شده، رهیافت هایمبتنی بر ترکیب طبقه بندها از موفقیت قابل توجهی برخوردار بوده اند. علی رغم انواع روشهای طبقه بندی موثر انجام شدهبرای امتیازدهی اعتباری، هنوز برخی چالش ها از قبیل، کم توجهی به طبقه بندی داده های نامتوازن و انواع روشهاینمونه برداری در آن برای ارزیابی های اعتباری و عدم استفاده از نمونه برداری داده ها با توجه به اهمیت داده ها برای متوازننمودن داده های آموزشی به صورت حل نشده باقی مانده است. دراین مقاله با توجه به چالش های مطرح شده، رهیافتی برایامتیازدهی اعتباری مبتنی بر ترکیب طبقه بندی و بیش نمونه برداری مصنوعی برای داده های نامتوازن، موسوم به RW-SVDDBoost ارایه شده است. مدل طبقه بندی پیشنهادی شامل سه مرحله است: ابتدا توصیفگر بردار پشتیبان داده که ازبردارهای پشتیبان به عنوان نمونه های با اهمیت بالاتر نسبت به کل داده ها بهره می برند، استفاده می شود. در مرحله ی دومبردارهای پشتیبان استخراج شده، با احتمال بیشتر به سمت داخل مرز طبقه بند، تولید نمونه های مصنوعی کلاس اقلیت را بااستفاده از گام تصادفی انجام می دهند. به این ترتیب، نمونه داده های آموزشی متوازن برای طبقه بند پایه ایجاد می شوند. درمرحله ی سوم در فرآیند Boosting ، با استفاده از معیار ناحیه ی زیر منحنی ROC کارایی طبقه بند پایه روی کل داده هامورد سنجش قرار می گیرد. ساختار پیشنهادی با تعدادی از الگوریتم های موجود در حوزه ی مسایل نامتوازن و روشهایترکیب بند موجود مقایسه شده و نتایج مطلوبیت آن را در مقایسه با برخی از الگوریتم ها از لحاظ دقت تایید می کند.

کلیدواژه ها:

امتیازدهی اعتباری ، طبقه بندی داده های نامتوازن ، گام تصادفی ، SVDD ، RUSBoost

نویسندگان

حنانه عباس زاده

گروه کامپیوتر،واحد زنجان،دانشگاه آزاد اسلامی،زنجان،ایران

علی امیری

گروه کامپیوتر،دانشکده ی فنی و مهندسی،دانشگاه زنجان،زنجان،ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • جلیلی، محمد. سامانه اعتبارسنجی مشتریان بانکی و بیمه ای - ...
  • امیری، علی؛ افشارچی، محسن؛ پیرمحمدی، عباس. طبقه‌بندی داده‌های نامتوازن با ...
  • G. Wang, J. Ma, L. Huang, and K. Xu.(2012). Two ...
  • I. Brown and . Mues .(2012). An experimental comparison of ...
  • L. Breiman.(1994). Heuristics of instability and stabilization in model selection ...
  • A. I. Marques, V. Garcia, and J. S. Sanchez. (2013). ...
  • L. Nanni and A. Lumini.(2009). An experimental comparison of ensemble ...
  • M. Galar, A. Fernandez, E. Barrenechea, H. Bustince, and F. ...
  • Van Hulse, and A. Napolitano.(20 1 _ RUSBoost: A .ل ...
  • A. Asuncion, D.J. Newman .(2007).UCl Machine Learning Repository, University of ...
  • Alcal a-Fdez, A. Fern andez, J. Luengo, J. Derrac, S. ...
  • D. Zhang, X. Zhou, S. C. H. Leung, and J. ...
  • Z. Ding.(2011). Diversified Ensemble Classifiers for Highly Imbalanced Data Learning ...
  • H. Zhang and M. Li.(20 1 4). RWO-sa mpling: A ...
  • D. M. J. Tax and R. P. W. Duin.(1999).Data Domain ...
  • K. Lee, D. W. Kim, D. Na, K. H. Lee, ...
  • D. West, S. Dellana, and J. Qian.(2005) .Neural network ensemble ...
  • R. E. Schapire.(1990). "The Strength of Weak Learnability, " Mach. ...
  • _ 7 Chawla, A. Lazarevic, L. O. Hall, and K. ...
  • P. TAN , M. STEINBACH, V. KUMAR.(2006). Introduction To Data ...
  • نمایش کامل مراجع