شناسایی هرزنامه ها با استفاده از الگوریتم دسته بندی درخت تصمیم با یک رویکرد مبتنی برکاهش بعد، تحلیل مولفه های اساسی
- سال انتشار: 1394
- محل انتشار: نخستین کنفرانس بین المللی فناوری اطلاعات
- کد COI اختصاصی: FBFI01_114
- زبان مقاله: فارسی
- تعداد مشاهده: 1209
نویسندگان
دانشجوی کارشناسی ارشد مهندسی نرم افزار، دانشگاه آزاد اسلامی واحد بروجرد،
دانشگاه صنعتی امیرکبیر،دانشکده ریاضی و علوم کامپیوتر
چکیده
محبوبیت روزافزون و کم بودن هزینه پست الکترونیکی این زمینه را فراهم کرده است تا بسیاری اقدام به ارسال نامه های الکترونیکی ناخواسته درحجم انبوه کنند. این نامه ها به اصطلاح هرزنامه نامیده می شوند. هرزنامه ها یکی از بزرگترین مشکلات کاربران پست الکترونیکی هستند که سبب اتلاف وقت، کاهش امنیتو کاهش کارایی کامپیوتر می شوند. برای غلبه بر این مشکل روشهای مختلفی ارائه شده است. در این مقاله یک روش برای شناسایی و دسته بندی ایمیل ها به دو دسته هرزنامه یا اسپم و نامه معتبر با غیر اسپم براساس الگوریتم درخت تصمیم ارائه نموده ایم.در روش پیشنهادی از الگوریتم کاهش بعد، تحلیل مولفه های اساسی(PCA) برای کاهش بعد فضای ویژگی ها استفاده نموده ایم و همچنین الگوریتم ترکیبیBagging را روی الگوریتم درخت تصمیم اعمال نموده ایم. روش پیشنهادی روی مجموعه داده استاندارد، Lingspam ارزیابی شده است. تاکنون الگوریتم های زیادی برای شناسایی هرزنامه ها توسط الگوریتم های یادگیری ماشین در مقالات ارائه شده که نتایج حاصل از ارزیابی روش پیشنهادی نشان می دهد که روش پیشنهادی باعث بالابردن معیارهای دقت، صحت ،بازخوانی و کارایی دسته بندی هرزنامه ها شده است.کلیدواژه ها
پست الکترونیکی، هرزنامه ، یادگیری ماشین ، دسته بندی، کاهش بعد ، درخت تصمیم ، الگوریتم ترکیبیمقالات مرتبط جدید
- طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
- تحول دیجیتال با قراردادهای هوشمند بر پایه فناوری بلاکچین
- تحلیل و شناسایی آسیبپذیریهای ناش ی از حملات شرایط رقابتی در برنامه های وب مدرن
- مروری بر الگوریتم بهینه سازی ازدحام ذرات و کاربردها
- بهینه سازی زمانبندی و ذخیره سازی نتایج وظایف در محیطهای مه-ابر با یادگیری تقویتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.