انتخاب ویژگی با الگوریتم های تکاملی در طبقه بندی متون فارسی

  • سال انتشار: 1393
  • محل انتشار: همایش ملی الکترونیکی دستاوردهای نوین در علوم مهندسی و پایه
  • کد COI اختصاصی: AEBSCONF01_321
  • زبان مقاله: فارسی
  • تعداد مشاهده: 959
دانلود فایل این مقاله

نویسندگان

اکرم رشدی

دانشگاه آزاد اسلامی واحد خوی

چکیده

امروزه با افزایش روزافزون حجم اطلاعات متنی، وجود روش های طبقه بندی متون ضروری به نظر می رسد. هم چنین با رشد فزاینده ی منابع متنی فارسی این مهم بیشتر احساس می شود هرچند که هنوز کارهای صورت گرفته مخصوصاً در زمینه ی طبقه بندی متون فارسی به گستردگی لاتینی، چینی و غیره نیست. در این مقاله مدلی مبتنی بر الگوریتم ژنتیک و گروه ذرات پیشنهاد شده است که از مجموعه ای را انتخاب یا استخراج می کند و درمرحله بعد از چهار طبقه بند بیزین ساده NB ماشین بردار پشتیبان SVM، درخت تصمیم گیری DT و K نزدیکترین همسایه KNN برای طبقه بندی متون فارسی استفاده شده است.نتایج آزمایش های به دست آمده از اجرای سیستم ارائه شده بر روی مجموعه متون همشهری، حاکی از بهبود دقت، فراخوانی و کارآیی کل آن است هرچند که طبقه بندی کننده ی SVM در این تحقیق از عملکرد بهتری برخوردار است.

کلیدواژه ها

بردار ویژگی، طبقه بندی، ماشین های بردار پشتیبان، متن کاوی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.