رده بندی متون با استفاده از تکنیک ترکیبی مبتنی بر زیرمجموعه ویژگی

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 759

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCSE01_128

تاریخ نمایه سازی: 9 بهمن 1392

چکیده مقاله:

با رشد جشم گیر اسناد متنی دیجیتال نیاز به یافتن اطلاعات مفید از این متون افزایش یافته و رده بندی خودکار متون، تکنولوژی کلیدی برای پاسخ به این نیاز است. به ازای هر سند متنی، واژه ها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه، رده بند با مشکل ابعاد زیاد ویژگی مواجه است. هدف از این پژوهش، طراحی یک سیستم رده بندی کاراست که با حداقل ویژگی، کارایی نهایی یادگیرنده را افزایش دهد. در این سیستم یک روش ترکیبی همگن، مبتنی بر زیرمجموعه های متفاوت ویژگی بررسی شده است که باعث بهبود کارایی رده بند پایه در حداقل تعداد ویژگی می گردد. به منظور تولید زیرمجموعه ها از تکنیک های فیلتری و در مرحله ی یادگیری، رده بند SVM استفاده شده است. نتایج به دست آمده بر روی مجموعه داده ی رویترز – 21578، نشان دهنده ی کارایی بالای سیستم ارائه شده نسبت به رده بند منفرد است. به طوری که کارایی 0/97 در معیار میکرو- F1 و 0/921 در معیار ماکرو- F1 به دست آمده است.

نویسندگان

سمانه شریفیان

دانشکده مهندسی شهید چمران اهواز

علیرضا عصاره

دانشکده مهندسی شهید چمران اهواز

بیتا شادگار

دانشکده مهندسی شهید چمران اهواز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • G. M. Di Nunzio, "Using Scatterplots to Understand and Improve ...
  • N. Azam and J. T. Yao, "Comparison of Term Frequency ...
  • S. Wang, et al., "A feature selection method based on ...
  • F. Debole and F Sebastiani, "Supervised Term Weighting for Automated ...
  • J. Chen, et al., "Feature selection for text classification with ...
  • _ _ _ ; _ _ _ _ _ _ ...
  • W. Shang, et al., "A Novel Feature Selection Algorithm for ...
  • A. McCallum and K. Nigam, "A Comparison of Event Models ...
  • S. B. Kim, et al., "Some Effective Techniques for Naive ...
  • Z. Sun, et al., "A Cluster Tree Method For Text ...
  • T. Joachims, "Text Categorization with Support Vector Machines: Learning with ...
  • M. Lan, et al., "Supervised and Traditional Term Weighting Methods ...
  • I. K. Ludmila, "Relationships Between Combination Methods and Measures of ...
  • _ _ _ _ _ _ _ _ Text Classification; ...
  • Y. Bi, et al., "Combining Multiple Classifiers Using Dempster s ...
  • K. Sarinnapakorn and M. Kubat, "Combining subclassifiers in text categorization: ...
  • F. Sebastiani, "Machine Learning in Automated Text Categorization, " ACM ...
  • H. T. Ng, et al, "Feature selection, perceptron learning , ...
  • L. Galavotti, et al., "Experiments on the use of feature ...
  • Z. Zheng and R. Srihari, "Optimally combining positive and negative ...
  • G. P. C. Fung, et al., "A balanced ensemble approach ...
  • R. Bryll, et al., "Attribute bagging: improving accuracy of classifier ...
  • E. Yu and S. Cho, "Constructing response model using ensemble ...
  • M. Galar, et al., "A Review o Ensembles for the ...
  • Reuters-2157 Dataset, (september 2012). Available: http://www. daviddlewis. com/res ourc es/tes ...
  • M. H. Aghdam, et al., "Text feature selection using ant ...
  • نمایش کامل مراجع