انتخاب ویژگی داده های متنی مبتنی بر روش های فیلتر و الگوریتم بهینه سازی فاخته

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 129

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFIT01_1269

تاریخ نمایه سازی: 15 دی 1403

چکیده مقاله:

روش های مبتنی بر فیلتر یکی از روش های سریع انتخاب ویژگی است اما کارائی مدل طبقه بندی کننده با درنظر نگرفتن اهمیت ویژگی ها در کنار یکدیگر دراین روش تحت تاثیر منفی قرار خواهد گرفت. در این مقاله یک روش ترکیبی جدید با ترکیب چهار روش مبتنی بر فیلتر و الگوریتم بهینه سازی فاخته (COA) برای انتخاب ویژگی در داده های متنی به شکل کارا و غلبه بر مشکل ذکر شده ارائه خواهد شد. این روش شامل دو مرحله پی درپی است. درمرحله اول ویژگی های زائد و بی فایده به منظور کاهش پیچیدگی و بهبود زمان اجراء حذف می شود. سپس COA در گام دوم به دنبال مینیموم تعداد ویژگی ممکن که منجر به ماکزیموم دقت طبقه بندی کننده بیز ساده از میان بردار ویژگی متنی حاصل از مرحله قبل شود به جستجو می پردازد. ارزیابی عملکرد روش پیشنهادی بر روی دیتاست رویترز-۲۱۵۷۸ آزمایش شده است. الگوریتم ارائه شده دارای برتری از نظر حداقل تعداد ویژگی انتخابی، دقت و دیگر شاخص های ارزیابی نظیر F-Score, Percision و Recall در مقایسه با الگوریتم های جستجوی مشابه نظیر PSO, GA در انتخاب ویژگی داده های متنی با خود به همراه دارد.

نویسندگان

معصومه اشرفی

گروه کامپیوتر، واحد علوم تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران.