شناسایی هرزنامه ها به کمک داده کاوی و ویژگی های ایمیل

  • سال انتشار: 1399
  • محل انتشار: پنجمین همایش بین المللی افق های نوین در مهندسی برق، کامپیوتر و مکانیک
  • کد COI اختصاصی: MHCONF05_118
  • زبان مقاله: فارسی
  • تعداد مشاهده: 544
دانلود فایل این مقاله

نویسندگان

سحر عزیزی

کارشناسی ارشد کامپیوتر، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی، واحد خرم آباد، ایران

فاطمه عزیزی

کارشناسی ارشد کامپیوتر، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی، واحد خرم آباد، ایران

چکیده

پست الکترونیک با ایمیل یکی از روش های ساده و ا رزان برای برقراری ارتباطات در محیط اینترنت است. امروزه خدمات پست الکترونیک توسط شرکت های مختلفی برای کاربران آنلاین ارائه می شود تا بتواند از این ابزار مفید در جهت برقراری ارتباطات خود از آن استفاده نمایند. سرویس پست الکترونیک دارای امکانات مختلفی مانند ارسال متن، تصویر و فایل های مختلف است و از این رو بشدت مورد ت وجه کاربران شبکه اینترنتی قرار گرفته شده است. هرزنامه ها یا ایمیل های تبلیغاتی یکی از چالش های مهم پست الکترونیک یا ایمیل به شمار می رود و هر روزه بر تعداد آنها افزوده می شود. ارسال هرزنامه ها توسط افراد و حتی شرکت های بزرگ به منظور تبلیغات، مزاحمت و کلاهبرداری برای کاربران ارسال می شود و وقت زیادی از کاربران را برای حذف یا خواندن آنها تلف می نماید. هدف از این پژوهش ارائه یک روش مبتنی بر داده کاوی است تا هرزنامه های ارسالی به کاربران شناسایی شود. در این پژوهش یک روش جدید مبتنی بر خوشه بندی و شبکه عصبی مصنوعی چند لایه به عنوان تکنیک های داده کاوی ارائه می شود تا بر اساس ویژگی های مهم پست الکترونیک یا ایمیل اقدام به شناسایی هرزنامه ها شود. در روش پیشنهادی برای بهبود طبقه بندی ایمیل ها به دو دسته عادی و هرزنامه از الگوریتم تکاملی بهینه سازی ذرات نیز استفاده شده تا دقت شبکه عصبی مصنوعی در تشخیص هرزنامه ها افزایش یابد. نتایج پیاده سازی ما بر روی مجموعه داده Spambase نشان می دهد که روش پیشنهادی با دقت حدود 95.46%، صحت 94.72% و حساسیتی برابر 92.54% قادر است هرزنامه ها را تشخیص دهد.

کلیدواژه ها

هرزنامه، پست الکترونیک، داده کاوی، خوشه بندی، شبکه عصبی مصنوعی، الگوریتم بهینه سازی ذرات

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.