یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 681

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CCCI09_057

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

در این پژوهش، روشی برای تشخیص مشاهدات ناهنجار استوار در تشخیص تقلب کارت های اعتباری ارایه شده است. به طور کلی تشخیص تقلب، یک مسیله طبقه بندی با نظارت است که در آن تراکنش های کارت های اعتباری، به دو کلاس قانونی و کلاهبردارانه طبقه بندی میشوند. این پژوهش به دنبال آن است که بتواند مشاهدات ناهنجاری که توسط الگوریتم های مختلف داده کاوی به عنوان مشاهدات کلاهبردانه تشخیص داده شده است را پیدا کند. تشخیص مشاهدات ناهنجار استوار در این پژوهش سه مرحله دارد: ابتدا با توجه به اینکه در مجموعه دادهی در دسترس، نقاط پرت به صورت برچسب مشخص نشده اند، با استفاده از روش جنگل تصادفی، امتیازهای پرت بودن هر مشاهده محاسبه می شود. هر چه این امتیاز بیشتر باشد، احتمال اینکه آن مشاهده، یک مشاهدهی ناهنجار باشد، بیشتر میشود. سپس در سه سناریوی مختلف مشاهداتی که 15%، 20%، 25% بیشترین امتیازها را دارند، به عنوان برچسب کلاهبردارانه (مثبت) و سایر مشاهدات به عنوان مشاهدات قانونی طبقه بندی میشوند. آنگاه در هر سناریو، دو مدل دسته بندی میزان شده ی درخت تصمیم گیری Bagging و رگرسیون لوژستیک، جهت تشخیص نقاط پرت روی مجموعه داده ها برازش داده میشوند. سپس نتایج آنها با هم مقایسه می شوند و در نهایت مشاهداتی که در هر دو الگوریتم فوق، به عنوان مشاهدات پرت پیش بینی شده اند، به عنوان مشاهدات پرت استوار (یا با اطمینان بالا) در نظر گرفته می شوند

نویسندگان

سید مژان احمدیان

دانشجوی کارشناسی ارشد موسسه آموزش عالی شهاب دانش، قم

سید امیر اصغری توچایی

استادیار دانشکده مهندسی برق و کامپیوتر دانشگاه خوارزمی، تهران، ایران

قربان خردمندیان

دکتری مهندسی کامپیوتر دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر