بررسی کارایی روش‌های ترکیبی در کلاس بندی داده های متنی

  • سال انتشار: 1391
  • محل انتشار: همایش منطقه ای علوم کامپیوتر، مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: DOROUDIT01_084
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1736
دانلود فایل این مقاله

نویسندگان

محمد حسین نجات

دانشجوی کارشناسی ارشد نرم افزار - دانشگاه آزاد اسلامی واحد زنجان

واهه آغازاریان

استادیار گروه مهندسی کامپیوتر - دانشگاه آزاد اسلامی واحد تهران مرکزی

علیرضا هدایتی

استادیار گروه مهندسی کامپیوتر - دانشگاه آزاد اسلامی واحد تهران مرکزی

چکیده

روزانه با اضافه شدن حجم زیادی از داده‌های متنی دیجیتال نیاز به آنالیز این نوع داده‌ها یکی از مسائلی است که توجه محققان را به خود جلب کرد ده است. متن کاویفرایندی است که با بررسی متون ، به کسب دانش از داده‌های متنی می‌پردازد . یکی از کاربردهای متن کاوی طبقه‌بندی خودکار متن می‌باشد. بدین معنا که به صورت خودکار تأیید می‌شود چگونگی متنی جدید ورودی به چه کلاس تعلق دارد .در این تحقیق کارایی روش‌های ترکیبی شناخته‌شده داده کاوی از قبیل رأی‌گیری، بهینه‌سازی، جمع‌آوری خودکار و ترکیب چند کلاس بندی به صورت ترکیبی را مورد بررسی قرار می‌دهیم سپس روش‌های ترکیبی مختلف را نیز بر روی مجموعه داده استاندارد 21578 Reuters به کمک نرم‌افزار WEKA مورد آزمایش قرار می‌دهیم. برای این کار پارامترهای مختلف کارایی که نسبت نظیر دقت، مقیاس پذیری به هزینه زمانی را مورد بررسی قرار داده‌ایم.

کلیدواژه ها

متن کاوی، روش‌های ترکیبی کلاس بندی، مقیاس پذیری، دقت کلاس بندی، هزینه زمانی ساخته مدل

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.