دسته بندی خودکار متون با استفاده از تکنیک های داده کاوی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,097

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCOS02_017

تاریخ نمایه سازی: 5 مهر 1393

چکیده مقاله:

داده کاوی شامل مجموعه ای از فنون است که به استخراج اطلاعات مفیدی که در انبوه داده ها به صورت مخفی و یا پنهان است، کمک می کند. دانش استخراج شده در قالب مد لها، الگوها و یا قواعدی ارائه میشود. این دانش یا اطلاعات به دست آمده میتواند ملاک تصمیم گیری های آتی، عملکردهای بعدی و یا تغییرات لازم جهت بهبود سیستم قرار گیرند. با توجه به رشد روزافزون دسترسی به اینترنت و اسناد الکترونیکی، دسته بندی خودکار متون اهمیت ویژه ای یافته است. دسته بندی متون عمل برچسب گذاری موضوعی متون بر مبنای یک مجموعه از پیش تعیین نشده میباشد. دسته بندی متون به طور کلی به دو بخش اصلی انتخاب ویژگی و الگوریتم یادگیری تقسیم می شود. در ارتباط با تکنیکهای انتخاب ویژگی و الگوریتم های یادگیری، رو شهای متنوعی ارائه شده است. هدف در تکنیکهای ارائه شده، بالا بردن دقت دسته بندی و رسیدن به کارایی مطلوب میباشد . در این مقاله مهم ترین و کاراترین تکنی کهای انتخاب ویژگی و نیز الگوریتم های یادگیری مورد تحلیل و بررسی قرار می گیرند و در نهایت پیشنهاداتی جهت استفادهبهینه تر از این تکنیکها صورت م یگیرد. با توجه به این نکته که هر کدام از رو شهای ارائه شده در کنار مزایای خود دارای معایبی نیز می باشند، بررسی این تکنیکها میتواند در ارائه تکنیکهای جدید که نقاط ضعف تکنیکهای پیشین را پوشش دهد، موثر باشد.

کلیدواژه ها:

داده کاوی ، دسته بندی خودکار متون ، انتخاب ویژگی ، الگوریتم یادگیری

نویسندگان

محمد بهروزیان نژاد

دانشگاه آزاد اسلامی واحد علوم و تحقیقات کرمان، گروه کامپیوتر، کرمان، ایران

ایمان عطارزاده

دانشگاه آزاد اسلامی واحد دزفول، گروه کامپیوتر، دزفول، ایران

مهدی حسین زاده

دانشگاه آزاد اسلامی واحد علوم و تحقیقات، گروه کامپیوتر، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • معاونت آموزشی، پژوهشی و فرهنگی سازمان سما دانشکده فنی و ...
  • S. Manne and , S. Fatima, _ Novel Approach for ...
  • K. Nirmala and . Pushpa, :Feature based Text Classification _ ...
  • K.Gayathri and A.Marimuthu, "Text Categorization using PDDP with Support Vector ...
  • E. H. Han, G. Karypis and V. Kumar, _ Categorization ...
  • S. S. Dadhania and , S. Dhobi, "Improved kNN Algorithm ...
  • _ _ _ _ Computers, vol. 4, No. 3, pp. ...
  • Y. Hongwei and Z. Wei, "Application of Ant Colony algorithm ...
  • S. Kim, K. Han, H. Rim, and S. H. Myaeng, ...
  • M. J. Meena, and K. R. Chandran, "Naive bayes text ...
  • C. M. Rahman, F. A. Sohel, P. Naushad and S. ...
  • International Conference _ Information Technology, Kathmandu, Nepal, pp. 234-241, 2003. ...
  • Learning in Automated Text Machine:ء [11] F. Sebastiani, Categorization" _ ...
  • V. Korde and . N. Mahender, _ CLAS SIFICATION AND ...
  • M. Dash and l Liu, :Feature selection for classification Intelligent ...
  • J. Sheinvald and B. Dom, _ Modeling Approach to feature ...
  • Y. Yang, and J. A. Pedersen, "A comparative study on ...
  • Y. Yang, :An Evaluation of Statistical Approaches to Text C ...
  • L. Galavotti, S. Fabrizio, and M. Simi, :Feature Selection and ...
  • _ Korde, C. N. Mahen der, TEXT CLAS SIFICATION AND ...
  • _ _ _ _ International Conference on Research and Development ...
  • Y. Bi and D. Be, "Classification Decision Combination for Text ...
  • D. A. Bell, J. W. Guan and Y. X. Bi, ...
  • _ _ _ _ 3131, pp. 127-138, 2004. ...
  • Z. Zheng, S. Zhou and A. Zhou, "Sequential Classifiers Combination ...
  • E. Frank, C. Chui and I. H. Witten, :Text categorization ...
  • G. Bisson and F. Hussain, "Chi-Sim: A New Similarity Measure ...
  • for the Co-clustering Task", Proceedings of the _ Conference on ...
  • L. Baoli, Y. Shiwen, L. Qin, _ improved k-nearest neighbor ...
  • نمایش کامل مراجع