تشخیص ایمیل های Spam با استفاده از الگوریتم Naïve Bayes
عنوان مقاله: تشخیص ایمیل های Spam با استفاده از الگوریتم Naïve Bayes
شناسه ملی مقاله: ECME17_010
منتشر شده در هفدهمین کنفرانس ملی مهندسی برق، کامپیوتر و مکانیک در سال 1401
شناسه ملی مقاله: ECME17_010
منتشر شده در هفدهمین کنفرانس ملی مهندسی برق، کامپیوتر و مکانیک در سال 1401
مشخصات نویسندگان مقاله:
مهدی قزلسفلو - دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین (ع)
محمدعلی جوادزاده - استادیار دانشگاه جامع امام حسین علیه السلام
خلاصه مقاله:
مهدی قزلسفلو - دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین (ع)
محمدعلی جوادزاده - استادیار دانشگاه جامع امام حسین علیه السلام
روزانه حجم عظیمی از ایمیل ها در سراسر جهان در حال تبادل هستند که تقریبا نیمی از آن ها هرزنامه است. هرزنامه هایایمیلی به اشکال مختلفی ارسال می شوند. بسیاری از آن ها تنها پیام های آزار دهنده ای هستند که هدف شان جلب توجه مخاطببه اطلاعات نادرست است. برخی از آن ها ایمیل های فیشینگ هستند و قصد دارند مخاطب را به دنبال کردن پیوندهای مخربیا دانلود بدافزارها ترغیب کنند. تلاش های زیادی برای خودکارسازی روند شناسایی هرزنامه ها انجام شده که به کارگیرییادگیری ماشین موثرترین و کارآمدترین روش اثبات شده ای است که تاکنون ارائه دهندگان این خدمات از آن استفاده کرده اند.با این حال، تشخیص هرزنامه دارای فرآیند پیچیده ای است که مستلزم انجام فعالیت های بسیاری است. گاهی اوقات مرز میانایمیل های قانونی و هرزنامه ها بسیار کم است و از طرفی معیارهای تشخیص با گذشت زمان تغییر می کنند. ارائه دهندگانخدمات ایمیلی وظیفه سنگین فیلتر کردن هرزنامه ها و اطمینان از معتبربودن فرستنده پیام ها توسط کاربرانشان را بر عهدهدارند. با این حال، هرزنامه ها در یک موضوع وجه مشترک دارند، آن ها بدون هدف و به شکل تصادفی برای کاربران مختلفارسال می شوند. یک الگوریتم ردیاب هرزنامه باید راهی برای فیلتر کردن هرزنامه ها پیدا کند و در عین حال مراقب باشد تاپیام های معتبر کاربران را فیلتر نکند. به بیان دقیق تر، در زمان شیوع بیماری های فراگیر، نزدیک شدن به زمان انتخابات، تمایلکاربران به رمزارزها و موارد این چنین به تحلیل دقیق اطلاعاتی نیاز است تا الگوریتم ها بتوانند هرزنامه های مبتنی بر اینمفاهیم را شناسایی و مسدود کنند. در این پژوهش در راستای رسیدن به روشی باصرفه اقتصادی و دارای دقت و سرعت وکارایی بالا ایمیل های هرزنامه را از ایمیل های قانونی با دقت بالای ۸۰ درصد جداسازی نموده ایم.
کلمات کلیدی: الگوریتم های یادگیری ماشین، ایمیل هرزنامه، ایمیل قانونی، الگوریتم بیزین، طبقه بندی
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1636249/