مروری بر متن کاوی؛ مفاهیم؛ تکنیکها و چالشها

  • سال انتشار: 1394
  • محل انتشار: سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات
  • کد COI اختصاصی: CITCONF03_458
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1288
دانلود فایل این مقاله

نویسندگان

مهدی اسماعیلی

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی کاشان ایران

عطیه زاهد

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی کاشان ایران

چکیده

داده کاوی به دنبال کشف الگوی سودمند در میان حجم انبوهی از داده ها است در این میان رشد بی اندازه داده های متنی؛ اهمیت متن کاوی را دو چندان کرده است در متن کاوی دانش مفید از میان اسناد ناساختمند متنی استخراج می شود بدون تردید میتوان ادعا کرد که رایجترین و محبوبترین شکل داده ها متون هستند وجود رسانه های اجتماعی مانند وبلاگ ها و شبک های اجتماعی خود تایید کننده این موضوع است هرچند میتوان از الگوریتمهای دااده کاوی در متن کاوی نیز استفاده کرد اما ماهیت این داده ها باعث شده است تا پژوهشگران این حوزه به دنبال روشهای خاص خود باشد. در این مقاله مایلیم مروری اجمالی و مختصر به این روشها و تکنیکها وهمچنین چالشهای انها داشته باشیم.

کلیدواژه ها

متن کاوی خوشه بندی ؛ دسته بندی؛ عقیده کاوی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.