بهبود دسته بندی متون با استفاده از الگوریتم تکاملی فاخته و آتوماتای یادگیر

  • سال انتشار: 1395
  • محل انتشار: اولین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CEITECH01_102
  • زبان مقاله: فارسی
  • تعداد مشاهده: 625
دانلود فایل این مقاله

نویسندگان

مژگان رحیمی راد

عضو گروه کامپیوتر، واحد سوسنگرد، دانشگاه آزاد اسلامی، سوسنگرد، ایران

مریم قنواتی

عضو گروه کامپیوتر، واحد سوسنگرد، دانشگاه آزاد اسلامی، سوسنگرد، ایران

چکیده

با توجه به رشد روزافزون دسترسی به اینترنت واسناد الکترونیکی، بهبود دسته بندی خودکار متون اهمیت ویژه ای یافته است. دسته بندی خودکار متون عمل برچسب گذاری موضوعی متون، بر مبنای یک مجموعه از پیش تعیین شده می باشد. دسته بندی متون به طور کلی به دو بخش اصلی انتخاب ویژگی والگوریتم یادگیری تقسیم می شد. هدف از انتخاب ویژگی، کاهش تعداد ویژگی ها تا حد ممکن است تا ویژگی های افزونه و غیر مرتبط حذف شوند و کارایی دسته بند بهتر شود. در ارتباط با تکنیک های انتخاب ویژگی و الگوریتم های یادگیری، روش های متنوعی ارایه شده است. هدف در تکنیک های ارایه شده، بالا بردن دقت دسته بندی و رسیدن به کارایی مطلوب می باشد. روش انتخاب ویژگی به کارگرفته شده از نوع زیر می باشد و از دسته بندها برای ارزیابی نتیجه استفاده می کند. روش پیشنهادی با استفاده از الگوریتم تکاملی فاخته و آتوماتای یادگیر با ساختار ثابت از نوع مهاجرت اشیا پیاده سازی ومورد ارزیابی قرار گرفته است. سپس روش پیشنهادی را با الگوریتم بهینه سازی انبوه ذرات برای انتخاب ویژگی مقایسه کرده ایم، که نتایج شبیه سازی در بیشتر موارد نشان دهنده برتری الگوریتم پیشنهادی می باشد.

کلیدواژه ها

متن کاوی، انتخاب ویژگی، دسته بندی، الگوریتم بهینه سازی فاخته، آتوماتای یادگیر

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.