بررسی روشهای متوازن سازی داده ها در تشخیص ناهنجاری داده های مالی به کمک مدلهای یادگیری گروهی

  • سال انتشار: 1402
  • محل انتشار: ششمین کنفرانس ملی فناوری های نوین در مهندسی برق و کامپیوتر
  • کد COI اختصاصی: ICTI06_080
  • زبان مقاله: فارسی
  • تعداد مشاهده: 113
دانلود فایل این مقاله

نویسندگان

محمدمهدی یادگار

دانشجوی کارشناسی ارشد نرم افزار دانشگاه علم و صنعت ایران

حسین رحمانی

استادیار دانشگاه علم و صنعت ایران

پری ناز سلطان زاده

دانشجوی کارشناسی ارشد نرم افزار دانشگاه علم و صنعت ایران

آسیه باقری

دانشجوی کارشناسی ارشد نرم افزار دانشگاه شهید بهشتی

چکیده

در سالهای اخیر پیدایش فناوریهای جدید باعث شده است تا این نوع فناوریها و اینترنت به طور گسترده ای وارد مباحث مالی و تجاری شوند. این گستردگی باعث ایجاد فرصت برای مهاجمان مخرب شده است تا با استفاده از راههای مختلف کلاهبرداری هزینه ی زیادی را برای شرکت ها به وجود آورند. کشف مناسب تقلب به بازرسان اجازه میدهد تا اقدامات به موقع انجام دهند و از تقلبات بیشتر و خسارات مالی جلوگیری کنند. اعمال بررسیهای دستی برای شناسایی کلاهبرداری زمان بر و پرهزینه است. فناوریهای جدید به ما این امکان را میدهند تا بتوانیم با شناسایی نمونه های کلاهبردار و شناخت الگوهای آنها سیستمی ایجاد کنیم که بتواند کلاهبرداریهای آینده را شناسایی با پیشگیری کند. در سال های اخیر استفاده از الگوریتمهای یادگیری ماشین برای شناسایی کلاهبرداری در داده های مالی مورد توجه قرار گرفته است. در اکثر مجموعه داده های مالی برای شناسایی تقلب مشکل نامتوازن بودن داده وجود دارد. این موضوع باعث میشود که استفاده از الگوریتم های یادگیری ماشین به طور مستقیم ناکارآمد باشد. در این مقاله قصد داریم با استفاده از مجموعه داده ی کارت اعتباری و با کمک روشهای متوازن سازی داده به شناسایی روشی مناسب تر در شناخت ناهنجاری در داده های مالی بپردازیم همچنین به منظور ارزیابی روش پیشنهادی از معیارهای ارزیابی رایج و ماتریس سردرگمی استفاده شده است. استفاده از این روشهای متوازن سازی داده در مدلهای مختلف نتایج متفاوتی را از خود نشان می دهد. ولی مدل توانست به حدود ۱۰ درصد بهبود در معیار یادآوری نسبت به حالت بدون نمونه برداری دست پیدا کند.

کلیدواژه ها

کشف کلاهبرداری داده های مالی یادگیری ماشین کارت اعتباری یادگیری گروهی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.