دسته بندی خودکار هرزنامه ها بوسیله الگوریتم های یادگیری ماشین

  • سال انتشار: 1401
  • محل انتشار: اولین کنفرانس بین المللی مهندسی برق و کامپیوتر
  • کد COI اختصاصی: IRCNFE01_021
  • زبان مقاله: فارسی
  • تعداد مشاهده: 394
دانلود فایل این مقاله

نویسندگان

عرفانه نوروزی

گروه مهندسی کامپیوتر ، دانشکده فنی مهندسی ، دانشگاه آزاد اسلامی ، قشم ، ایران

هدایت علیمرادی دوکوهی

گروه مهندسی کامپیوتر ، دانشکده فنی مهندسی ، دانشگاه آزاد اسلامی ، قشم ، ایران

سجاد احمدی

گروه مهندسی کامپیوتر ، دانشکده فنی مهندسی ، دانشگاه آزاد اسلامی ، قشم ، ایران

چکیده

افزایش حجم ایمیل های ناخواسته به نام هرزنامه نیاز شدیدی به توسعه فیلترهای ضد اسپم قابل اعتمادتر و قوی تر ایجاد کرده است. روش های اخیر یادگیری ماشینی برای شناسایی و فیلتر کردن ایمیل های هرزنامه با موفقیت استفاده می شود. به دلیل ارزان بودن ارسال اطلاعات از طریق ایمیل روشی برای تولید کنندگان اسپم و کسانی که اهداف خاصی دارند مورد استفاده قرار می گیرد. اسپمر تنها بخش بسیار کوچکی از دریافت کنندگان را ممکن است مورد هدف قرار دهد. جلوگیری و فیلتر کردن اسپم ها می تواند ترافیک شبکه را بهبود بخشد. روش های یادگیری ماشین و متن کاوی جهت حل مشکل بالا معرفی شده اند.که البته نیازمند فرایند خاصی همچون پیش پردازش،انتخاب ویژگی ، استخراج ویژگی و در نهایت انتخاب یک الگوریتم کارآمد موثر و یک ماشین یادگیر سریع می باشند. در این مقاله با استفاده از مجموعه جمع آوری شده استاندارد اسپم ، پنج الگوریتم یادگیری به همراه دو الگوریتم انتخاب و استخراج ویژگی ارزیابی می شود و در نهایت نتایج روش به وسیله دسته بند های ترکیبی نیز بهبود داده خواهند شد تا یک روش با قابلیت کارآیی بالا و نرخ خطای پایین گردد.

کلیدواژه ها

موتورهای جستجو ، اسپم، هرزنامه، تشخیص هرزنامه، یادگیری ماشین، داده کاوی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.