یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری

سید مژان احمدیان; سید امیر اصغری توچایی; قربان خردمندیان

یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری

محل انتشار: نهمین کنفرانس ملی فرماندهی و کنترل ایران

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 617

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/661395

شناسه ملی سند علمی:

CCCI09_057

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

در این پژوهش، روشی برای تشخیص مشاهدات ناهنجار استوار در تشخیص تقلب کارت های اعتباری ارایه شده است. به طور کلی تشخیص تقلب، یک مسیله طبقه بندی با نظارت است که در آن تراکنش های کارت های اعتباری، به دو کلاس قانونی و کلاهبردارانه طبقه بندی میشوند. این پژوهش به دنبال آن است که بتواند مشاهدات ناهنجاری که توسط الگوریتم های مختلف داده کاوی به عنوان مشاهدات کلاهبردانه تشخیص داده شده است را پیدا کند. تشخیص مشاهدات ناهنجار استوار در این پژوهش سه مرحله دارد: ابتدا با توجه به اینکه در مجموعه دادهی در دسترس، نقاط پرت به صورت برچسب مشخص نشده اند، با استفاده از روش جنگل تصادفی، امتیازهای پرت بودن هر مشاهده محاسبه می شود. هر چه این امتیاز بیشتر باشد، احتمال اینکه آن مشاهده، یک مشاهدهی ناهنجار باشد، بیشتر میشود. سپس در سه سناریوی مختلف مشاهداتی که 15%، 20%، 25% بیشترین امتیازها را دارند، به عنوان برچسب کلاهبردارانه (مثبت) و سایر مشاهدات به عنوان مشاهدات قانونی طبقه بندی میشوند. آنگاه در هر سناریو، دو مدل دسته بندی میزان شده ی درخت تصمیم گیری Bagging و رگرسیون لوژستیک، جهت تشخیص نقاط پرت روی مجموعه داده ها برازش داده میشوند. سپس نتایج آنها با هم مقایسه می شوند و در نهایت مشاهداتی که در هر دو الگوریتم فوق، به عنوان مشاهدات پرت پیش بینی شده اند، به عنوان مشاهدات پرت استوار (یا با اطمینان بالا) در نظر گرفته می شوند

کلیدواژه ها:

تشخیص تقلب ، مشاهدات ناهنجار استوار ، جنگل های تصادفی ، کارت های اعتباری

نویسندگان

سید مژان احمدیان

دانشجوی کارشناسی ارشد موسسه آموزش عالی شهاب دانش، قم

سید امیر اصغری توچایی

استادیار دانشکده مهندسی برق و کامپیوتر دانشگاه خوارزمی، تهران، ایران

قربان خردمندیان

دکتری مهندسی کامپیوتر دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر