یافتن مشاهدات ناهنجار استوار بر اساس الگوریتم داده کاوی جنگل تصادفی در تشخیص تقلبکارت های اعتباری
محل انتشار: نهمین کنفرانس ملی فرماندهی و کنترل ایران
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 681
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CCCI09_057
تاریخ نمایه سازی: 29 مهر 1396
چکیده مقاله:
در این پژوهش، روشی برای تشخیص مشاهدات ناهنجار استوار در تشخیص تقلب کارت های اعتباری ارایه شده است. به طور کلی تشخیص تقلب، یک مسیله طبقه بندی با نظارت است که در آن تراکنش های کارت های اعتباری، به دو کلاس قانونی و کلاهبردارانه طبقه بندی میشوند. این پژوهش به دنبال آن است که بتواند مشاهدات ناهنجاری که توسط الگوریتم های مختلف داده کاوی به عنوان مشاهدات کلاهبردانه تشخیص داده شده است را پیدا کند. تشخیص مشاهدات ناهنجار استوار در این پژوهش سه مرحله دارد: ابتدا با توجه به اینکه در مجموعه دادهی در دسترس، نقاط پرت به صورت برچسب مشخص نشده اند، با استفاده از روش جنگل تصادفی، امتیازهای پرت بودن هر مشاهده محاسبه می شود. هر چه این امتیاز بیشتر باشد، احتمال اینکه آن مشاهده، یک مشاهدهی ناهنجار باشد، بیشتر میشود. سپس در سه سناریوی مختلف مشاهداتی که 15%، 20%، 25% بیشترین امتیازها را دارند، به عنوان برچسب کلاهبردارانه (مثبت) و سایر مشاهدات به عنوان مشاهدات قانونی طبقه بندی میشوند. آنگاه در هر سناریو، دو مدل دسته بندی میزان شده ی درخت تصمیم گیری Bagging و رگرسیون لوژستیک، جهت تشخیص نقاط پرت روی مجموعه داده ها برازش داده میشوند. سپس نتایج آنها با هم مقایسه می شوند و در نهایت مشاهداتی که در هر دو الگوریتم فوق، به عنوان مشاهدات پرت پیش بینی شده اند، به عنوان مشاهدات پرت استوار (یا با اطمینان بالا) در نظر گرفته می شوند
کلیدواژه ها:
نویسندگان
سید مژان احمدیان
دانشجوی کارشناسی ارشد موسسه آموزش عالی شهاب دانش، قم
سید امیر اصغری توچایی
استادیار دانشکده مهندسی برق و کامپیوتر دانشگاه خوارزمی، تهران، ایران
قربان خردمندیان
دکتری مهندسی کامپیوتر دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر