استفاده از یک الگوریتم منفرد و روش وزن دهی IDF برای جلوگیری و فیلتر کردن ایمیل های اسپم

  • سال انتشار: 1395
  • محل انتشار: اولین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CEITECH01_017
  • زبان مقاله: فارسی
  • تعداد مشاهده: 413
دانلود فایل این مقاله

نویسندگان

سیدمجتبی غرابی

دانشجو کارشناسی ارشد، گروه مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد خمین

حمید پایگذار

عضو هییت علمی دانشکده فنی مهندسی، گروه مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد خمین

چکیده

هدف و انگیزه اسپم این است که اطلاعاتی به گیرنده منتقل نماید که این اطلاعات مانند، تبلیغات برای یک محصول (که بهاحتمال زیاد بیارزش، غیر قانونی و یا غیر موجود)، طعمه برای یک طرح تقلب، ترویج یک آرمان و یا تخرب کامپیوتری که معمولاطراحی شده است که اغلب برای نفوذ و یا ربودن کامپیوتر دریافت کننده است. به دلیل ارزان بودن ارسال اطلاعات از طریق ایمیلروشی برای تولید کنندگان اسپم و کسانی که اهداف خاصی دارند مورد استفاده قرار می گیرد. تنها بخش بسیار کوچکی از دریافتکنندگان را ممکن است مورد هدف قرار دهند شاید این عدد یک در ده هزار یا کمتر می تواند باشد ولی جلوگیری و فیلتر کردن اسپمها خود باری از ترافیک شبکه را می تواند بهبود بخشد. اگر چه سال های اخیر معرفی تعداد زیادی از الگوریتم های دسته بندی متنیمطرح شده است ولی متن کاوی نیازمند یک سری مراحل پیش پردازش، الگوریتم موثرکارآمد و یادگیرنده سریع می باشند. در اینمقاله با آزمایش های که بر روی مجموعه داده اسپم انجام شده یک روش با قابلیت اعتماد بالا و نرخ خطای پایین را ارایه نموده ایم.

کلیدواژه ها

اسپم، هرزنامه، تشخیص هرزنامه، یادگیری ماشین، متن کاوی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.