انتخاب ویژگی در متون فارسی با استفاده از ترکیب الگوریتم های فراشناختی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 549

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP06_028

تاریخ نمایه سازی: 25 اسفند 1399

چکیده مقاله:

انتخاب ویژگی به طور گسترده در زمینه ی متن کاو ی برای ایجاد یک مدل با تعداد ویژگی های کمتر استفاده می شود. انتخاب ویژگی متن یک گام مهم در طبق هبندی متن است و به طور مستقیم بر عملكرد آن تأثیر می گذارد. در این مقاله یک روش بهبود انتخاب ویژگی برای طبقه بندی داده های بزر گ 3با استفاده از ترکیب الگوریتم های فراشناختی پیشنهاد می شود. در این روش از ترکیب الگوریتمبهینه سازی ازدحام ذره ها براساس لینک و الگوریتم جست و جوی گرانشی استفاده می شود. الگوریتم بهینه سازی ازدحام ذره ها بر اساس لینک، بهبودی از الگوریتم بهینه سازی ازدحام ذره ها است. در این پژوهش برای افزایش توان جست و جوی محلی این الگوریتم از الگوریتم جست و جوی گرانشی استفاده می شود. براساس ویژگ یهای انتخاب شده، مدل طبقه بندیِ کلاس بند نزدیک ترین همسایه ساخته می شود. در آخر نتایج بر اساس معیار ارزیابی مورد بررسی قرار می گیرد . عملكرد الگوریتم پیشنهادی بر روی مجموعه داده همشهری مورد بررسی قرار گرفته است. این مجموعه داده با استفاده از کتابخانه هضم پیش پردازش شده است و دو مجموعه داده تصادفی ایجاد شده است . نتایج ما نشان می دهد که روش پیشنهادی با انتخاب تعداد ویژگی کمتر در دو مجموعه داده تولید شده به ترتیب به افزایش دقت 97 / 3 % و 58 / 1 % رسیده است .

کلیدواژه ها:

انتخاب ویژگی ، داده های بزرگ ، الگوریتم جست و جوی گرانشی ، الگوریتم بهینه سازی ازدحام ذره ها ، متن کاوی ، پیش پردازش متن

نویسندگان

لیلا هاوشکی

دانشجوی کارشناسی ارشد نرم افزار، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم

محبوبه شمسی

استادیار، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم،

عبدالرضا رسولی کناری

استادیار، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم