رده بندی متون با استفاده از تکنیک ترکیبی مبتنی بر زیرمجموعه ویژگی
محل انتشار: همایش ملی علوم و مهندسی کامپیوتر
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 759
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCSE01_128
تاریخ نمایه سازی: 9 بهمن 1392
چکیده مقاله:
با رشد جشم گیر اسناد متنی دیجیتال نیاز به یافتن اطلاعات مفید از این متون افزایش یافته و رده بندی خودکار متون، تکنولوژی کلیدی برای پاسخ به این نیاز است. به ازای هر سند متنی، واژه ها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه، رده بند با مشکل ابعاد زیاد ویژگی مواجه است. هدف از این پژوهش، طراحی یک سیستم رده بندی کاراست که با حداقل ویژگی، کارایی نهایی یادگیرنده را افزایش دهد. در این سیستم یک روش ترکیبی همگن، مبتنی بر زیرمجموعه های متفاوت ویژگی بررسی شده است که باعث بهبود کارایی رده بند پایه در حداقل تعداد ویژگی می گردد. به منظور تولید زیرمجموعه ها از تکنیک های فیلتری و در مرحله ی یادگیری، رده بند SVM استفاده شده است. نتایج به دست آمده بر روی مجموعه داده ی رویترز – 21578، نشان دهنده ی کارایی بالای سیستم ارائه شده نسبت به رده بند منفرد است. به طوری که کارایی 0/97 در معیار میکرو- F1 و 0/921 در معیار ماکرو- F1 به دست آمده است.
کلیدواژه ها:
نویسندگان
سمانه شریفیان
دانشکده مهندسی شهید چمران اهواز
علیرضا عصاره
دانشکده مهندسی شهید چمران اهواز
بیتا شادگار
دانشکده مهندسی شهید چمران اهواز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :