مروری بر متن کاوی؛ مفاهیم؛ تکنیکها و چالشها

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,279

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCONF03_458

تاریخ نمایه سازی: 12 تیر 1395

چکیده مقاله:

داده کاوی به دنبال کشف الگوی سودمند در میان حجم انبوهی از داده ها است در این میان رشد بی اندازه داده های متنی؛ اهمیت متن کاوی را دو چندان کرده است در متن کاوی دانش مفید از میان اسناد ناساختمند متنی استخراج می شود بدون تردید میتوان ادعا کرد که رایجترین و محبوبترین شکل داده ها متون هستند وجود رسانه های اجتماعی مانند وبلاگ ها و شبک های اجتماعی خود تایید کننده این موضوع است هرچند میتوان از الگوریتمهای دااده کاوی در متن کاوی نیز استفاده کرد اما ماهیت این داده ها باعث شده است تا پژوهشگران این حوزه به دنبال روشهای خاص خود باشد. در این مقاله مایلیم مروری اجمالی و مختصر به این روشها و تکنیکها وهمچنین چالشهای انها داشته باشیم.

کلیدواژه ها:

متن کاوی خوشه بندی ، دسته بندی ، عقیده کاوی

نویسندگان

مهدی اسماعیلی

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی کاشان ایران

عطیه زاهد

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی کاشان ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • C. C. Aggarwal. Data Mining: The Textbook Springer, 2015. ...
  • Fabio Ciravegna. Adaptive information extraction from text by rule induction ...
  • Mary Elaine Califf and Raymond J. Mooney. Relational learning of ...
  • Lawrence R. Rabiner. A tutorial On hidden Markov models and ...
  • Jenny Finkel, Shipra Dingare, Christopher D. Manning, Malvina Nissim, Beatrice ...
  • Dan Klein, Joseph Smarr, Huy Nguyen, and Christopher D. Manning. ...
  • Andrew McCallum and Wei Li Barly results for named entity ...
  • Sunita Sarawagi and William W. Cohen. Semi-markov conditional random fields ...
  • Yee Seng Chan and Dan Rot. Exploiting syntactico -semantic structures ...
  • Jing Jiang and ChengXiang Zhai. A systematic exploration of the ...
  • Min Zhang, Jie Zhang, and Jian Su. Exploring syntactic features ...
  • Razvan Bunescu and Raymond Mooney. Subsequence kernels for relation extraction. ...
  • Eugene Agichtein and Luis Gravano. Snowball: Extracting relations from large ...
  • Truc Vien T. Nguyen and Alessandro Moschitti. End-to-end relation extraction ...
  • Cane Wing-ki Leung, Jing Jiang, Kian Ming A. Chai, Hai ...
  • Anthony Fader, Stephen Soderland, and Oren Etzioni Identifying relations for ...
  • M. Hu, A. Sun, and E.-P. Li. Comments -oriented blog ...
  • Q. Mei and C. Zhai. Generating impact-based summaries for scientific ...
  • S. Gupta, A. Nenkova, and D. Jurafsky. Measuring importance and ...
  • A. Celikyilmaz and D. Hakkani-Tur A hybrid hierarchical model for ...
  • D. Wang, S. Zhu, T. Li, and Y. Gong. Multi ...
  • M. Ozsoy, I. Cicekli, and F. Alpaslan. Text summarization of ...
  • S. Xie and Y. Liu. Using corpus and knowledge-b ased ...
  • A. Aker, T. Cohn, and R. Gaizauskas. Multi -document summarization ...
  • S. Gopal, Y. Yang. Multilabel classification with meta-level features. ACM ...
  • Y. Yang, J. O. Pederso. A comparative study on feature ...
  • S. Deerwester, S. Dumais, T. Landauer, G. Furnas, R. Harshma. ...
  • T. Hofmann. Probabilistic latent semantic indexing. ACM SIGIR Conference, 1999. ...
  • R. Duda, P. Hart, W. Stork. Patter Classification, Wiley Interscience, ...
  • M. Dash, H. Liu. Feature Selection for Clustering, PAKDD Conference, ...
  • W. Xu, X. Liu, Y. Gong. Document Clustering based On ...
  • C. C. Aggarwal, C. Zhai. Mining Text Data, Springer, 2012. ...
  • C. C. Aggarwal, S. C. Gates, P. S. Yu. On ...
  • Y. Zhao, G. Karypis. Evaluation of hierarchical clustering algorithms for ...
  • D. Cutting, D. Karger, J. Pedersen, J. Tukey. Scatter/Gather A ...
  • F. Beil, M. Ester, X. Xu. Frequent term-based text clustering, ...
  • _ A. Baeza-Yates, B. _ Ribeiro-Neto, Modern Information Retrieval - ...
  • Bing Liu. Sentiment Analysis: Mining Opinions, Sentiments and Emotions, Cambridge ...
  • Hu, M. and B. Liu. Mining and summarizing customer reviews. ...
  • Qiu, G., B. Liu, J. Bu, and C. Chen. Opinion ...
  • Pang, B. and L. Lee. Opinion mining and sentiment analysis. ...
  • Turney, P. Thumbs up or thumbs down?: semantic orientation applied ...
  • J. Gama. Knowledge Discovery from Data Streams, Chapman & Hall/CRC, ...
  • Koehn, P. (2009) Statistical Machine Translation. Cambridge University Press. ...
  • C. C. Aggarwal and H. Wang. Text mining in social ...
  • G. Barbier and H. Liu. Information Provenance in Social Media ...
  • A. B. Abacha and P Zweigenbaum. A hybrid approach for ...
  • J. W. Wilbur, A. Rzhetsky, and H. Shatkay. New directions ...
  • U. Leser and J. Hakenberg. What makes a gene name? ...
  • L. C. Lee, F. Horn, and F. E. Cohen. Automatic ...
  • G. Leech. Adding linguistic annotation. In M. Wynne, editor, Developing ...
  • T. Wattarujeekrit, P. Shah, and N. Collier. PASBio: Predic ateargument ...
  • A. B. Abacha and P. Zweigenbaum. Medical entity recognition: A ...
  • نمایش کامل مراجع