تشخیص هرزنامه در اینترنت با استفاده از انتخاب ویژگی مبتنی بر الگوریتم های فراابتکاری

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 505

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTI03_066

تاریخ نمایه سازی: 26 تیر 1399

چکیده مقاله:

هرزنامه ها یکی از چالش های اینترنت و کاربران آن است. توسط هرزنامه ها انواع بدافزار در اینترنت پخش می شود. از طرفی هرزنامه ها نقش مهمی در سرقت اطلاعات دارند و می توانند شامل لینکهای جعلی برای فریب کاربران باشند. یکی از روش های تشخیص هرزنامه استفاده از روش های یادگیری ماشین و داده کاوی مانند شبکه عصبی مصنوعی است. شبکه عصبی مصنوعی چند لایه برای تشخیص دقیق هرزنامه ها نیاز دارد ویژگی های مهم را به عنوان ورودی در نظر گرفته و خطای خروجی خود را کاهش دهد. در روش پیشنهادی برای انتخاب ویژگی از یک روش هوشمندانه و مبتنی بر الگوریتم های هوش گروهی استفاده شده است. در این پژوهش یک نسخه باینری از الگوریتم بهینه سازی پنگوئن برای انتخاب ویژگی جهت تشخیص هرزنامه ارائه شده است و تلاش شده تا ویژگیهای مهم برای یادگیری و طبقه بندی در تشخیص هرزنامه ارائه شوند. آزمایشات در محیط متلب و بر روی مجموعه داده Spambase نشان می دهند که با افزایش جمعیت خطای روش پیشنهادی در حدود 14٫61٪برای تشخیص هرزنامه از ایمیل کاهش یافته و از طرفی با افزایش جمعیت فضای ویژگی ها در بهترین حالت 43٫85٪کاهش خواهد یافت. آزمایشات نشان میدهند خطای روش پیشنهادی در تشخیص هرزنامه از شبکه عصبی مصنوعی چند لایه، شبکه عصبی بازگشتی، ماشین بردار پشتیبان، شبکه بیزین و الگوریتم بهینه سازی وال کمتر است. آزمایشات نشان می دهند الگوریتم پیشنهادی نسبت به الگوریتم بهینه سازی وال در حدود 23٫57 خطای کمتری در تشخیص هرزنامه دارد. پیاده سازی روش پیشنهادی و سایر روش ها در تشخیص هرزنامه نشان میدهد دقت روش شبکه عصبی مصنوعی چند لایه، شبکه عصبی مصنوعی بازگشتی، ماشین بردار پشتیبان، شبکه بیزین و روش پیشنهادی برای تشخیص هرزنامه به ترتیب برابر 94٫08٪، ٪83٫91، ٪91٫33، 84٫75 و 99٫6 ٪است. آزمایشات نشان میدهند روش های انتخاب ویژگی نظیر درخت تصمیم گیری، جنگل تصادفی، شبکه بیزین و روش پیشنهادی در شاخص دقت به ترتیب دارای مقادیر 98٫4 ٪ ، 97٫20، 76٪ و 99٫ 76٪بوده و روش پیشنهادی بیشترین دقت را دارد.

کلیدواژه ها:

تشخیص هرزنامه ، انتخاب ویژگی ، الگوریتم های فرا ابتکاری ، الگوریتم پنگوئن

نویسندگان

سحر حسین پناهی

کارشناسی ارشد مهندسی کامپیوتر - نرم افزار ، دانشگاه آزاداسلامی واحد سنندج

عبدالباقی قادرزاده

استادیار دانشگاه آزاداسلامی واحد سنندج ، گروه مهندسی کامپیوتر