تحلیل عملکرد الگوریتمهای انتخاب ویژگی در مدلهای یادگیری جمعی بهمنظور کشف تقلب در داده های مالی
سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 125
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICTBC07_015
تاریخ نمایه سازی: 26 اسفند 1402
چکیده مقاله:
امروزه تقلب در داده های مالی به یک نگرانی جدی در سطح جهانی تبدیل شدهاست. کشف به هنگام تقلب میتواند از وقوع تقلبات بیشتر و خسارات مالی جلوگیری کند. مرحله انتخاب ویژگیها، مهمترین مرحله در مسائل دادهکاوی برای کاهش ویژگیهای نامربوط از مجموعه داده اصلی است که میتواند » سرعت ردهبندها« را به دلیل کاهش اندازه مجموعه ویژگیها و »عملکرد مدلها« را به دلیل جلوگیری از بیشبرازش بهبود بخشد. ما در این مقاله به تحلیل عملکرد الگوریتمهای انتخاب ویژگی از ۴ دسته »آماری «، » مدلمحور «، »مبتنی بر درخت« و »تفسیرپذیری« بر روی مدلهای یادگیری جمعی میپردازیم و عملکرد آنها را بر روی ترکیبات مختلف از مدلهای منتخب در کارهای پیشین مورد ارزیابی قرار میدهیم. نتایج تجربی نشان میدهد الگوریتم تفسیرپذیری SHAP براساس معیارهای Precision و AUC-PR و الگوریتم درختی XGBoost براساس معیارهای F۱ و Recall بهترین عملکرد را در بین سایر الگوریتمها داشته و مجموعه ویژگیهای بهتری ارائه مینماید.
کلیدواژه ها:
نویسندگان
سجاد علیزاده فرد
کارشناسی ارشد مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران