ارائه روشی جدید برای کاهش ابعاد داده های بزرگ

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 541

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP05_021

تاریخ نمایه سازی: 6 آذر 1398

چکیده مقاله:

در طی دهه های اخیر، مجموعه های دادهای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های دادهای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگیها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتمهای طبقه بندی میشوند. از این رو انتخاب ویژگی، برای کاهش ابعاد مسئله و افزایش کارایی الگوریتمهای طبقه بندی پیشنهاد شده است. یکی از مسائلی که انتخاب ویژگی در آن ضروری است، طبقه بندی متون است. این مسئله در دسته مسائل چندجمله ای غیرقطعی-سخت قرار دارد؛ بنابراین الگوریتم های تکاملی دراین حوزه میتوانند قابل استفاده باشند.در حال حاضر، روشهای بسیاری جهت انتخاب ویژگی در متون وجود دارند. در این مقاله یک روش انتخاب ویژگی با استفاده الگوریتم ژنتیک ارائه میشود. استفاده از تئوری اطلاعات برای محاسبه ی تابع ارزیابی، نخستین بار در این مقاله ارائه شده است. عملکرد روش پیشنهادی با شناخته شده ترین و جدیدترین روشهای انتخاب ویژگی، بر روی طبقه بند -kنزدیکترین همسایه مقایسه شده است. نتایج به دست آمده از پیاده سازی روش پیشنهادی بر روی مجموعه دادهی رویترز بیانگر دقتی برابر 85,41٪ است.

کلیدواژه ها:

کاهش ابعاد ، انتخاب ویژگی ، خوشه بندی ، الگوریتم ژنتیک و طبقه بندی متون.

نویسندگان

عاطفه عباسی

گروه علوم کامپیوتر، دانشگاه تبریز، تبریز

حبیب ایزدخواه

گروه علوم کامپیوتر ، دانشگاه تبریز ، تبریز

شهریار لطفی

گروه علوم کامپیوتر ، دانشگاه تبریز ، تبریز