CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

امتیازدهی اعتباری مشتریان با استفاده از الگوریتم RUSBoost توسعه یافته و توصیف گرداده ی مبتنی بر بردارپشتیبان با گام برداری تصادفی

عنوان مقاله: امتیازدهی اعتباری مشتریان با استفاده از الگوریتم RUSBoost توسعه یافته و توصیف گرداده ی مبتنی بر بردارپشتیبان با گام برداری تصادفی
شناسه ملی مقاله: ITCC03_081
منتشر شده در سومین کنگره بین المللی کامپیوتر، برق و مخابرات در سال 1395
مشخصات نویسندگان مقاله:

حنانه عباس زاده - گروه کامپیوتر،واحد زنجان،دانشگاه آزاد اسلامی،زنجان،ایران
علی امیری - گروه کامپیوتر،دانشکده ی فنی و مهندسی،دانشگاه زنجان،زنجان،ایران

خلاصه مقاله:
امتیازدهی اعتباری مشتریان یکی از ابزارهای مدیریت ریسک در سیستم های بانکی است. طراحی طبقه بندهایی که بتوانندشناسایی بهتر مشتریان بانکی را به درستی انجام دهند به عنوان یکی از چالش های اساسی در داده کاوی و یادگیری ماشین،مورد مطالعه ی بسیاری از محققان قرار گرفته است. در سال های اخیر در میان تحقیقات ارزشمند انجام شده، رهیافت هایمبتنی بر ترکیب طبقه بندها از موفقیت قابل توجهی برخوردار بوده اند. علی رغم انواع روشهای طبقه بندی موثر انجام شدهبرای امتیازدهی اعتباری، هنوز برخی چالش ها از قبیل، کم توجهی به طبقه بندی داده های نامتوازن و انواع روشهاینمونه برداری در آن برای ارزیابی های اعتباری و عدم استفاده از نمونه برداری داده ها با توجه به اهمیت داده ها برای متوازننمودن داده های آموزشی به صورت حل نشده باقی مانده است. دراین مقاله با توجه به چالش های مطرح شده، رهیافتی برایامتیازدهی اعتباری مبتنی بر ترکیب طبقه بندی و بیش نمونه برداری مصنوعی برای داده های نامتوازن، موسوم به RW-SVDDBoost ارایه شده است. مدل طبقه بندی پیشنهادی شامل سه مرحله است: ابتدا توصیفگر بردار پشتیبان داده که ازبردارهای پشتیبان به عنوان نمونه های با اهمیت بالاتر نسبت به کل داده ها بهره می برند، استفاده می شود. در مرحله ی دومبردارهای پشتیبان استخراج شده، با احتمال بیشتر به سمت داخل مرز طبقه بند، تولید نمونه های مصنوعی کلاس اقلیت را بااستفاده از گام تصادفی انجام می دهند. به این ترتیب، نمونه داده های آموزشی متوازن برای طبقه بند پایه ایجاد می شوند. درمرحله ی سوم در فرآیند Boosting ، با استفاده از معیار ناحیه ی زیر منحنی ROC کارایی طبقه بند پایه روی کل داده هامورد سنجش قرار می گیرد. ساختار پیشنهادی با تعدادی از الگوریتم های موجود در حوزه ی مسایل نامتوازن و روشهایترکیب بند موجود مقایسه شده و نتایج مطلوبیت آن را در مقایسه با برخی از الگوریتم ها از لحاظ دقت تایید می کند.

کلمات کلیدی:
امتیازدهی اعتباری، طبقه بندی داده های نامتوازن، گام تصادفی، SVDD, RUSBoost

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/576169/