PRESENTING A NEW FEATURE SELECTION METHOD USING CFS WITH LINEAR-FORWARD-SELECTION ALGORITHM FOR E-MAIL SPAM FILTERING

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 621

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NPECE01_072

تاریخ نمایه سازی: 6 بهمن 1395

چکیده مقاله:

The purpose of this research is presenting an machine learning approach for accuracy enhancement of detecting andfiltering automatic spam and separating them from legitimate messages. In this regard, for reducing the error rate andincreasing the efficiency, a new architecture on feature selection has been used. Features used in these systems, are the body of text messages. Proposed system of this research has used Correlation-based feature selection (CFS) withLinear-Forward-Selection algorithm. In addition, Multinomial Naïve Bayes (MNB) classifier, Discriminative Multinomial Naïve Bayes (DMNB) classifier, Support Vector Machine (SVM) classifier and Random Forest classifier are used for classification. Finally, the output results of this classifiers methods are examined and the best design is selected and it is compared with Previous similar works by considering different parameters. The accuracy of the proposed system is evaluated equal to 98%.

نویسندگان

Seyed Mostafa Pourhashemi

Department of Computer, Dezful Branch, Islamic Azad university, Dezful, Iran

Ali Bakhthemmat

Department of Computer, Sharif University of Technology, Tehran, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Zhu, Y., Tan, Y. A Lo c al _ C ...
  • Besavaraju, M., Prabhakar, R. A Novel Method of Spam Mail ...
  • Michelakis, E., et al. A Learning-B ased Anti-Spam Filter. Proceedings ...
  • Beiranvand, A., et al. Spam Filtering By Using a Compound ...
  • Chang, M., Poon, CK. Using Phrases as Features in Email ...
  • Geng, X, et al. Feature Selection for Ranking. Proceedings of ...
  • Hall, M. Correlation-B ased Feature selection for discrete and numeric ...
  • LingSpam Public Corpus, _ : //www. aueb , gr/u sers/ion/pub ...
  • Kibriya, A.M., et al. Multinomial Naive Bayes for Text Categorization ...
  • Schneider, K.M. A comparison of event models for Naive Bayes ...
  • Hall, M. Discriminative Multinomial Naive Bayes for Text Classificatio. Community ...
  • Su, J.; et al. Discriminative Parameter Learning for Bayesian Networks. ...
  • Alpaydin, E. Introduction o Machine Learning, Second Edition. The MIT ...
  • Keerthi, S.S., et al. Improvements to Platt's SMO Algorithm for ...
  • Biau, G., et al. Consistency of Random Forests and Other ...
  • Breiman, L. Random Forests. Published in Journal of Machine Learning, ...
  • Barigou, F., Beldjilali, B., Atmani, B. Using Cellular Automata for ...
  • Shams, R., Mercer, R.E. Classifying Spam Emails using Text and ...
  • نمایش کامل مراجع