روشی مقاوم مبتنی بر بهینه سازی چند هدفه برای انتخاب ویژگی از دااده های ابعاد بالا به منظور دسته بندی اسناد

  • سال انتشار: 1394
  • محل انتشار: سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات
  • کد COI اختصاصی: CITCONF03_248
  • زبان مقاله: فارسی
  • تعداد مشاهده: 624
دانلود فایل این مقاله

نویسندگان

مریم کرباسی

کارشناسی ارشد کامپیوتر نرمافزار دانشگاه علوم و تحقیقات واحد نیشابور ایران

محمدحسین معطر

استادیار گروه کامپیوتر دانشگاه آزاد اسلامی واحد مشهد ایران

چکیده

با توجه به اینکه دسته بندی اسناد منجر به بازیابی اطلاعات مناسب می شود ولی ابعاد بالای فضای ویژگی های یک چالش مهم در کارایی دسته بندی اسناد است این چالش موجب کاهش صحت و پیچیدگی بالای محاسبات در الگوریتم های یادگیری ماشین جهت دسته بندی اسناد می شود در این مقاله یک روش ترکیبی مبتنی بر تصفیه و پوشش مبتنی بر الگوریتم NSGAII جهت کاهش ابعاد با هدف حفظ دقت دسته بندی اسناد پیشنهاد داده ایم. سپس ویژگی های مازاد رااز مجموعه بهینه ویژگیها حذف نموده ایم. باتوجه به آزمایشات انجام شده بر روی مجموعه داده رویترز؛ میزان صحت روش پیشنهادی با استفاده از دسته بندی Naïve Bayes 0.906 و با استفاده از دسته بند 0.916 است و همچنین میزان مقاومت روش پیشنهادی 78 درصد می باشد.

کلیدواژه ها

دسته بندی اسناد؛ انتخاب ویژگی؛ ورش ترکیبی؛ الگوریتم NSGAII

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.