ارایه روش جدید برای استخراج داده های نامتعادل در صنعت بیمه با استفاده از الگوریتم ترکیبی kRNN – Boost

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 526

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

PECCON01_054

تاریخ نمایه سازی: 24 شهریور 1397

چکیده مقاله:

افزایش روزافزون حجم اطلاعات باعث به وجود آمدن داده های متعادل و نامتعادل در بانک های اطلاعاتی شده است که برای دسته بندی مسایل دودویی، یکی از چالش ها وجود داده های نامتعادل می باشد که در مجموعه داده ها ممکن است دسته هایی با حجم اکثریت و اقلیت به وجود آید و مسلما اگر نمونه برداری روی این مسایل صورت گیرد، نمونه ها با حجم داده اکثریت، اغلب نمونه های با حجم داده اقلیت را تحت تاثیر قرار می دهند. برای روبرو شدن با این چالش و متعادل نمودن مجموعه داده ها در این پژوهش از الگوریتم kRNN و Boost استفاده خواهد شد تا از یک روش ترکیبی جدید برای استخراج مجموعه داده های نامتعادل در صنعت بیمه استفاده شود. روند کار پژوهش به این صورت است که برای ارزیابی ایده به حالت کلاسیک ، 20 درصد داده ها از طریق روش نمونه گیری تصادفی انتخاب و برای بررسی عملکرد روش پیشنهادی کنار گذاشته خواهد شد و از میان 80 درصد داده های باقیمانده چون مجموعه های داده های مورد استفاده در حوزه بانکداری نامتعادل اند و دارای نمونه با برچسب های بسیار زیاد و بسیار کم می باشند و هدف متعادل نمودن داده ها است در نتیجه نمونه های با حجم اقلیت و اکثریت از هم جدا خواهند شد.

نویسندگان

بهنام محمدی

دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی استان زنجان زنجان، ایران

مهدی افضلی

دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی استان زنجان زنجان، ایران