تشخیص وب سایت های فیشینگ با استفاده از ترکیب الگوریتم کاهش ابعاد و بگینگ

  • سال انتشار: 1402
  • محل انتشار: اولین کنفرانس ملی آنالیز داده ها
  • کد COI اختصاصی: CDASCI01_087
  • زبان مقاله: فارسی
  • تعداد مشاهده: 156
دانلود فایل این مقاله

نویسندگان

اکبر حسنعلی پور

دانشجوی کارشناسی ارشد، مهندسی امنیت و فضای سایبر، دانشگاه جامع علوم انتظامی امین،تهران، ایران

صادق مشرف زاده

گروه کامپیوتر،دانشکده فنی و مهندسی، واحد یاسوج،دانشگاه آزاد اسلامی ،یاسوج،ایران

چکیده

فیشینگ روشی برای جمع آوری اطلاعات شخصی افراد با استفاده از ایمیل ها و وب سایت های فریبنده است. فیشینگ یکی از رایج ترین حملات سایبری است. فیشینگ یک نوع حمله مهندسی اجتماعی است که هدف آن بدست آوردن سرقت اطلاعات شخصی افراد جامعه ، فروشگاه های اینترنتی و... از طریق وب سایت های جعلی می باشد. در این مقاله، برای میزان دقت تشخیص حملات وب سایت های فیشینگ از یک مجموعه داده که شامل ۹۹۹۹ نمونه می باشد و هر نمونه ۳۰ در آن بررسی شده است، استفاده کردیم. برای پیاده سازی میزان دقت تشخیص وب سایت های فیشینگ از ترکیب الگوریتم کاهش ابعاد و الگوریتم بگینگ استفاده کردیم. با استفاده از الگوریتم کاهش ابعاد تعداد ویژگی ها رو از ۳۰ به ۹ کاهش دادیم بعد با الگوریتم بگینگ میزان دقت تشخیص حملات وب سایت های فیشینگ بدست آوردیم. این الگوریتم طبقه بندی کننده های ترکیبی چندین دسته را با هم ترکیب می کند. در واقع این طبقه بندی کننده ها هر کدام مدل خود را روی داده ها می سازند و این مدل را ذخیره می کنند. در نهایت برای طبقه بندی از بین این دسته ها رای گرفته می شود و کلاسی که بیشترین رای را کسب کند کلاس نهایی است. برای نتایج پیاده سازی از ابزار weka که یک ابزار داده کاوی است، استفاده کردیم. با استفاده از ترکیب این دو الگوریتم توانستیم میزان دقت تشخیص حملات وب سایت های فیشینگ را ۹۷.۳۱ % افزایش دهیم.

کلیدواژه ها

وب سایت های فیشینگ، الگوریتم کاهش ابعاد، الگوریتم بگینگ

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.