امتیازدهی اعتباری مشتریان با استفاده از الگوریتم RUSBoost توسعه یافته و توصیف گرداده ی مبتنی بر بردارپشتیبان با گام برداری تصادفی

  • سال انتشار: 1395
  • محل انتشار: سومین کنگره بین المللی کامپیوتر، برق و مخابرات
  • کد COI اختصاصی: ITCC03_081
  • زبان مقاله: فارسی
  • تعداد مشاهده: 696
دانلود فایل این مقاله

نویسندگان

حنانه عباس زاده

گروه کامپیوتر،واحد زنجان،دانشگاه آزاد اسلامی،زنجان،ایران

علی امیری

گروه کامپیوتر،دانشکده ی فنی و مهندسی،دانشگاه زنجان،زنجان،ایران

چکیده

امتیازدهی اعتباری مشتریان یکی از ابزارهای مدیریت ریسک در سیستم های بانکی است. طراحی طبقه بندهایی که بتوانندشناسایی بهتر مشتریان بانکی را به درستی انجام دهند به عنوان یکی از چالش های اساسی در داده کاوی و یادگیری ماشین،مورد مطالعه ی بسیاری از محققان قرار گرفته است. در سال های اخیر در میان تحقیقات ارزشمند انجام شده، رهیافت هایمبتنی بر ترکیب طبقه بندها از موفقیت قابل توجهی برخوردار بوده اند. علی رغم انواع روشهای طبقه بندی موثر انجام شدهبرای امتیازدهی اعتباری، هنوز برخی چالش ها از قبیل، کم توجهی به طبقه بندی داده های نامتوازن و انواع روشهاینمونه برداری در آن برای ارزیابی های اعتباری و عدم استفاده از نمونه برداری داده ها با توجه به اهمیت داده ها برای متوازننمودن داده های آموزشی به صورت حل نشده باقی مانده است. دراین مقاله با توجه به چالش های مطرح شده، رهیافتی برایامتیازدهی اعتباری مبتنی بر ترکیب طبقه بندی و بیش نمونه برداری مصنوعی برای داده های نامتوازن، موسوم به RW-SVDDBoost ارایه شده است. مدل طبقه بندی پیشنهادی شامل سه مرحله است: ابتدا توصیفگر بردار پشتیبان داده که ازبردارهای پشتیبان به عنوان نمونه های با اهمیت بالاتر نسبت به کل داده ها بهره می برند، استفاده می شود. در مرحله ی دومبردارهای پشتیبان استخراج شده، با احتمال بیشتر به سمت داخل مرز طبقه بند، تولید نمونه های مصنوعی کلاس اقلیت را بااستفاده از گام تصادفی انجام می دهند. به این ترتیب، نمونه داده های آموزشی متوازن برای طبقه بند پایه ایجاد می شوند. درمرحله ی سوم در فرآیند Boosting ، با استفاده از معیار ناحیه ی زیر منحنی ROC کارایی طبقه بند پایه روی کل داده هامورد سنجش قرار می گیرد. ساختار پیشنهادی با تعدادی از الگوریتم های موجود در حوزه ی مسایل نامتوازن و روشهایترکیب بند موجود مقایسه شده و نتایج مطلوبیت آن را در مقایسه با برخی از الگوریتم ها از لحاظ دقت تایید می کند.

کلیدواژه ها

امتیازدهی اعتباری، طبقه بندی داده های نامتوازن، گام تصادفی، SVDD, RUSBoost

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.