فیلتر کردن هرزنامه های پست الکترونیکی با روش های ترکیبی یادگیری ماشین
- سال انتشار: 1399
- محل انتشار: پنجمین همایش بین المللی افق های نوین در مهندسی برق، کامپیوتر و مکانیک
- کد COI اختصاصی: MHCONF05_068
- زبان مقاله: فارسی
- تعداد مشاهده: 550
نویسندگان
دانشجوی کارشناسی ارشد موسسه آموزش عالی اشراق بجنورد
استادیار, گروه کامپیوتر ,مجتمع آموزش عالی فنی و مهندسی اسفراین
چکیده
افزایش حجم هرزنامه ها، نیاز به یک سیستم دقیق و کارای فیلترینگ هرزنامه در پست الکترونیکی را نتیجه خواهدداد. هدف این تحقیق،ارائه ی یک روش یادگیری ماشین ترکیبی برای بالابردن کارایی در تشخیص و فیلتر کردنخودکار این هرزنامه ها و تفکیک آنها از پیام های قانونی می باشد. استفاده از تلفیق روشهای ترکیبی یادگیری ماشین وپردازش های پست الکترونیک متن - گرا، خصوصا در بخش فیلترهای انتخاب ویژگی تا کنون بسیار محدود انجام پذیرفتهو روش های ترکیبی پیشین خطای نسبتا بالایی در تشخیص هرزنامه ها داشته اند. در این مقاله، از یک روش ترکیبیجدید در فاز انتخاب ویژگی استفاده شده است. در این روش، ابتدا عملیات پیش پردازش بر روی متون پیام ها انجامپذیرفته، پس از آن ویژگیهای استخراج شده به دو فیلتر پشت سر هم داده شده و بهترین ویژگی ها بعنوان ویژگی هاینهایی، انتخاب شده و بادسته بندهای مختلف (با تنظیم پارامترهای مربوطه)، مورد تست قرار می گیرند . نتایج نشانمیدهد که کارایی این روش بالای 99 % می باشدکلیدواژه ها
هرزنامه، فیلتر کردن، انتخاب ویژگی، دسته بندی، یادگیری ماشینمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.