CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر متن کاوی؛ مفاهیم؛ تکنیکها و چالشها

عنوان مقاله: مروری بر متن کاوی؛ مفاهیم؛ تکنیکها و چالشها
شناسه ملی مقاله: CITCONF03_458
منتشر شده در سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات در سال 1394
مشخصات نویسندگان مقاله:

مهدی اسماعیلی - گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی کاشان ایران
عطیه زاهد - گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی کاشان ایران

خلاصه مقاله:
داده کاوی به دنبال کشف الگوی سودمند در میان حجم انبوهی از داده ها است در این میان رشد بی اندازه داده های متنی؛ اهمیت متن کاوی را دو چندان کرده است در متن کاوی دانش مفید از میان اسناد ناساختمند متنی استخراج می شود بدون تردید میتوان ادعا کرد که رایجترین و محبوبترین شکل داده ها متون هستند وجود رسانه های اجتماعی مانند وبلاگ ها و شبک های اجتماعی خود تایید کننده این موضوع است هرچند میتوان از الگوریتمهای دااده کاوی در متن کاوی نیز استفاده کرد اما ماهیت این داده ها باعث شده است تا پژوهشگران این حوزه به دنبال روشهای خاص خود باشد. در این مقاله مایلیم مروری اجمالی و مختصر به این روشها و تکنیکها وهمچنین چالشهای انها داشته باشیم.

کلمات کلیدی:
متن کاوی خوشه بندی ؛ دسته بندی؛ عقیده کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/467029/