انتخاب ویژگی داده های متنی مبتنی بر روش های فیلتر و الگوریتم بهینه سازی فاخته

معصومه اشرفی

انتخاب ویژگی داده های متنی مبتنی بر روش های فیلتر و الگوریتم بهینه سازی فاخته

محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات، مدیریت و کامپیوتر

سال انتشار: 1403

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 129

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2148688

شناسه ملی سند علمی:

CONFIT01_1269

تاریخ نمایه سازی: 15 دی 1403

چکیده مقاله:

روش های مبتنی بر فیلتر یکی از روش های سریع انتخاب ویژگی است اما کارائی مدل طبقه بندی کننده با درنظر نگرفتن اهمیت ویژگی ها در کنار یکدیگر دراین روش تحت تاثیر منفی قرار خواهد گرفت. در این مقاله یک روش ترکیبی جدید با ترکیب چهار روش مبتنی بر فیلتر و الگوریتم بهینه سازی فاخته (COA) برای انتخاب ویژگی در داده های متنی به شکل کارا و غلبه بر مشکل ذکر شده ارائه خواهد شد. این روش شامل دو مرحله پی درپی است. درمرحله اول ویژگی های زائد و بی فایده به منظور کاهش پیچیدگی و بهبود زمان اجراء حذف می شود. سپس COA در گام دوم به دنبال مینیموم تعداد ویژگی ممکن که منجر به ماکزیموم دقت طبقه بندی کننده بیز ساده از میان بردار ویژگی متنی حاصل از مرحله قبل شود به جستجو می پردازد. ارزیابی عملکرد روش پیشنهادی بر روی دیتاست رویترز-۲۱۵۷۸ آزمایش شده است. الگوریتم ارائه شده دارای برتری از نظر حداقل تعداد ویژگی انتخابی، دقت و دیگر شاخص های ارزیابی نظیر F-Score, Percision و Recall در مقایسه با الگوریتم های جستجوی مشابه نظیر PSO, GA در انتخاب ویژگی داده های متنی با خود به همراه دارد.

کلیدواژه ها:

الگوریتم بهینه سازی ، بهینه سازی ، ویژگی داده های ، روش های فیلتر

نویسندگان

معصومه اشرفی

گروه کامپیوتر، واحد علوم تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران.