بررسی کارایی روشهای ترکیبی در کلاس بندی داده های متنی
- سال انتشار: 1391
- محل انتشار: همایش منطقه ای علوم کامپیوتر، مهندسی کامپیوتر و فناوری اطلاعات
- کد COI اختصاصی: DOROUDIT01_084
- زبان مقاله: فارسی
- تعداد مشاهده: 1736
نویسندگان
دانشجوی کارشناسی ارشد نرم افزار - دانشگاه آزاد اسلامی واحد زنجان
استادیار گروه مهندسی کامپیوتر - دانشگاه آزاد اسلامی واحد تهران مرکزی
استادیار گروه مهندسی کامپیوتر - دانشگاه آزاد اسلامی واحد تهران مرکزی
چکیده
روزانه با اضافه شدن حجم زیادی از دادههای متنی دیجیتال نیاز به آنالیز این نوع دادهها یکی از مسائلی است که توجه محققان را به خود جلب کرد ده است. متن کاویفرایندی است که با بررسی متون ، به کسب دانش از دادههای متنی میپردازد . یکی از کاربردهای متن کاوی طبقهبندی خودکار متن میباشد. بدین معنا که به صورت خودکار تأیید میشود چگونگی متنی جدید ورودی به چه کلاس تعلق دارد .در این تحقیق کارایی روشهای ترکیبی شناختهشده داده کاوی از قبیل رأیگیری، بهینهسازی، جمعآوری خودکار و ترکیب چند کلاس بندی به صورت ترکیبی را مورد بررسی قرار میدهیم سپس روشهای ترکیبی مختلف را نیز بر روی مجموعه داده استاندارد 21578 Reuters به کمک نرمافزار WEKA مورد آزمایش قرار میدهیم. برای این کار پارامترهای مختلف کارایی که نسبت نظیر دقت، مقیاس پذیری به هزینه زمانی را مورد بررسی قرار دادهایم.کلیدواژه ها
متن کاوی، روشهای ترکیبی کلاس بندی، مقیاس پذیری، دقت کلاس بندی، هزینه زمانی ساخته مدلمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.