استفاده از تکنیک های داده کاوی در دسته بندی خودکار اسناد متنی

سال انتشار:

1393

نوع سند:

مقاله کنفرانسی

زبان:

فارسی

مشاهده:

1,374

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

FNCEITPNU01_081

تاریخ نمایه سازی: 17 اسفند 1393

چکیده مقاله:

امروزه بخش قابل توجهی از اطلاعات موجود در پایگاه داده های متنی یا اسناد متنی ذخیره می شوند. یکی از مهم ترین مباحثی که مطرح است بحث سازماندهی این اسناد می باشد. یکی از راهکارهای سازماندهی اسناد متنی، دسته بندی آنها می باشد. دسته بندی متون به انتساب اسناد متنی به دسته های واقعی آنها می باشد. دسته بندی اسناد متنی شامل دو مرحله اصلی انتخاب ویژگی و الگوریتم یادگیری می باشد. تاکنون روش های متعددی برای دسته بندی اسناد متنی ارائه شده است. در این مقاله یک روش ترکیبی جهت دسته بندی کارآتر اسناد متنی ارائه شده است. روش پیشنهادی در مرحله انتخاب ویژگی جهت کاهش پیچیدگی از روش فیلتری بهره می برد و با استفاده از دسته بندهای بیز ساده و درخت تصمیم پیاده سازی شده است. نتایج نشان دهنده برتری روش ترکیبی نسبت به دسته بندهای منفرد می باشد.

کلیدواژه ها:

داده کاوی ، اسناد متنی ، دسته بندی ، دسته بندی خودکار متون

نویسندگان

محمدبهروزیان نژاد
محمد بهروزیان نژاد

دانشجوی دکترای کامپیوتر، دانشگاه آزاد اسلامی واحد شوشتر، آموزشکده فنی و حرفه ای سما

ایمانعطارزاده
ایمان عطارزاده

استادیار رشته کامپیوتر، هیئت علمی، دانشگاه آزاد اسلامی واحد دزفول، گروه کامپیوتر

شادیافتخار
شادی افتخار

دانشجوی کارشناسی کامپیوتر، دانشگاه آزاد اسلامی واحد شوشتر، گروه کامپیوتر

احمدکاظمی
احمد کاظمی

هیئت علمی، دانشگاه آزاد اسلامی واحد ایذه، گروه کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Yang Y, and Pedersen J. A, A comparative study on ...
  • Dalal M. K, and Zaveri M A, Automatic Text Classificatio. ...
  • Dasgupta A, Feature selection methos for text classification, In Proceedings ...
  • Dataset available it http:/csmining. org/index .php/r52 _ and- r8-of-reuters- 2 ...
  • Khan A, Baharudin B, Lee L. H, and Khan K, ...
  • Manning C. D, Raghavan P, and Schutze H, Introduction o ...
  • Patra A, and Singh D, A Survey Report on Text ...
  • Ramasundram S, text categorization by B ackpropagation, Internatiomal Journal of ...
  • Sebastiani F, Machine Learning in Automated Text Categorization, ACM Computing ...
  • Software available in: http :/'rpid-i _ com/c otet/view/ 1 8 ...