تحلیل عملکرد الگوریتمهای انتخاب ویژگی در مدلهای یادگیری جمعی بهمنظور کشف تقلب در داده های مالی

سال انتشار: 1402
محل انتشار: هفتمین همایش بین المللی مهندسی فناوری اطلاعات، کامپیوتر و مخابرات ایران
کد COI اختصاصی: ICTBC07_015
زبان مقاله: فارسی
تعداد مشاهده: 56

نویسندگان

کارشناسی ارشد مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران

چکیده

امروزه تقلب در داده های مالی به یک نگرانی جدی در سطح جهانی تبدیل شدهاست. کشف به هنگام تقلب میتواند از وقوع تقلبات بیشتر و خسارات مالی جلوگیری کند. مرحله انتخاب ویژگیها، مهمترین مرحله در مسائل دادهکاوی برای کاهش ویژگیهای نامربوط از مجموعه داده اصلی است که میتواند » سرعت ردهبندها« را به دلیل کاهش اندازه مجموعه ویژگیها و »عملکرد مدلها« را به دلیل جلوگیری از بیشبرازش بهبود بخشد. ما در این مقاله به تحلیل عملکرد الگوریتمهای انتخاب ویژگی از ۴ دسته »آماری «، » مدلمحور «، »مبتنی بر درخت« و »تفسیرپذیری« بر روی مدلهای یادگیری جمعی میپردازیم و عملکرد آنها را بر روی ترکیبات مختلف از مدلهای منتخب در کارهای پیشین مورد ارزیابی قرار میدهیم. نتایج تجربی نشان میدهد الگوریتم تفسیرپذیری SHAP براساس معیارهای Precision و AUC-PR و الگوریتم درختی XGBoost براساس معیارهای F۱ و Recall بهترین عملکرد را در بین سایر الگوریتمها داشته و مجموعه ویژگیهای بهتری ارائه مینماید.

کلیدواژه ها

انتخاب ویژگی، یادگیری ماشین، تفسیرپذیری، یادگیری جمعی، داده کاوی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.