ارائه روشی جدید برای کاهش ابعاد داده های بزرگ
سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 628
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
DCBDP05_021
تاریخ نمایه سازی: 6 آذر 1398
چکیده مقاله:
در طی دهه های اخیر، مجموعه های دادهای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های دادهای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگیها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتمهای طبقه بندی میشوند. از این رو انتخاب ویژگی، برای کاهش ابعاد مسئله و افزایش کارایی الگوریتمهای طبقه بندی پیشنهاد شده است. یکی از مسائلی که انتخاب ویژگی در آن ضروری است، طبقه بندی متون است. این مسئله در دسته مسائل چندجمله ای غیرقطعی-سخت قرار دارد؛ بنابراین الگوریتم های تکاملی دراین حوزه میتوانند قابل استفاده باشند.در حال حاضر، روشهای بسیاری جهت انتخاب ویژگی در متون وجود دارند. در این مقاله یک روش انتخاب ویژگی با استفاده الگوریتم ژنتیک ارائه میشود. استفاده از تئوری اطلاعات برای محاسبه ی تابع ارزیابی، نخستین بار در این مقاله ارائه شده است. عملکرد روش پیشنهادی با شناخته شده ترین و جدیدترین روشهای انتخاب ویژگی، بر روی طبقه بند -kنزدیکترین همسایه مقایسه شده است. نتایج به دست آمده از پیاده سازی روش پیشنهادی بر روی مجموعه دادهی رویترز بیانگر دقتی برابر 85,41٪ است.
کلیدواژه ها:
نویسندگان
عاطفه عباسی
گروه علوم کامپیوتر، دانشگاه تبریز، تبریز
حبیب ایزدخواه
گروه علوم کامپیوتر ، دانشگاه تبریز ، تبریز
شهریار لطفی
گروه علوم کامپیوتر ، دانشگاه تبریز ، تبریز