انتخاب ویژگی به کمک الگوریتم ژنتیک و تشخیص هرزنامه با خوشه بندی سلسله مراتبی مرکزگرا

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 756

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCSC01_065

تاریخ نمایه سازی: 8 آبان 1395

چکیده مقاله:

اینترنت به طور چشمگیری ارتباط با دیگران را تغییر داده است. ایمیل یکی از سرویسهای که امروزه اینترنت برای کاربرانش فراهم می آورد. این سرویس به علت هزینه کم مورد توجه بسیاری از کاربران قرار گرفته است در کنار مزایای زیاد پست الکترونیکی، یکی از ضعفهای این سرویس این است که دائما بر تعداد ایمیلهایی که دریافت می گردد افزوده می شود. گسترش سریع این سرویس باعث شده عده ای درصد سوء استفاده از آن برآیند که نتیجه آن گسترش هرزنامه شده است، در واقع فیلتر هرزنامه، یک برنام کامپیوتری است که توانایی دسته بندی نامه های الکترونیکی را دارا می باشد، بیشتر این فیلترها از ترکیبی از چندین روش مانند فهرستهای سیاه یا سفید، فیلترهای بر پایه قانون و غیره برای شناسایی دقیقتر هرزنامه بهره می برند. در کاربردهای تجاری از ترکیب این روشهااستفاده می شود. در این تحقیق ما از الگوریتم ژنتیک برای انتخاب ویژگی های و سپس از خوشه بندی سلسله مراتبی برای تشخیص هرزنامه استفاده کرده و نتایج را با SVM و Naïve Bayesian مقایسه کرده ایم.

کلیدواژه ها:

هرزنامه ، خوشه بندی ، طبقه بندی ، الگوریتم ژنتیک ، خوشه بندی سلسله مراتبی

نویسندگان

روح الله بورکی

کارشناسی ارشد دانشگاه آزاد اسلامی واحد بوشهر ایران

علی هارون آبادی

دکتری دانشگاه آزاد اسلامی واحدتهران مرکز تهران ایران

مرضیه دادور

دکتری دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • MAAWG. "Messaging anti-abuse working group.Email metrics report".Third & fourth guarter ...
  • Lingspam dadaset available in: http:// ...
  • J. Goodman, _ Address in Email Clients, Conf on Emai ...
  • B. Watson, "Beyond Identity: Addressing Problems that Persist in an ...
  • A. Ciltik, T. Gungor, "Timeefficiet spam email filtering using ngram ...
  • M. Chang, C. K. Poon, "Using Phrases as Features in ...
  • B. Wang, et al, "Using Online Linear Classifiers to Filter ...
  • Thesaurus Construction for Automatic:ه [8] H. Hu, B. Yu, Spam ...
  • J. Meng, et al, "A TwoStage Feature Selection Method for ...
  • M. Blachnik, et al, :Feature Selection for Supervised Classification A ...
  • Corre lationBased Filter, Sympisium on method of Artificial Intelligence", vol. ...
  • M.Darrudi, F.Hejazi, E.Oroumchian, Assessment of a Moder Farsi Corpus, In ...
  • Workshop on Information Technology & its Disciplines (WITID'04), ITRC, Kish ...
  • Egghe, L. _ "The distribution of N-grams" .Scientometrics, 47((February) 2), ...
  • Ribeiro-Neto, B. _ Chapter 3 Retrieval evaluation.In Moder information retrieval ...
  • Khreisat L., "A machine learning approach for Arabic text classification ...
  • Proceeding of the 3nd Journal of Informetrics, page 72- 77, ...
  • Barari. L., Analoie. M. and Garmeh. M., "Machin Learning Methods ...
  • Basiri. M. A., Nemati. Sh. and Ghasemaghaie. N., "A Comparison ...
  • Maghsoodi. N. and Homayoonpour _ M. M., "A Novel Method ...
  • نمایش کامل مراجع