طبقه بندی داده های نامتوازن توسط الگوریتم ماشین بردار پشتیبانی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 810

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECMM01_081

تاریخ نمایه سازی: 23 آذر 1397

چکیده مقاله:

طبقه بندی داده ها، یکی از ابزارهای مهم در استخراج دانش از داده ها می باشد. یکی از حوزه های مهم در داده کاوی طراحی الگوریتم های کلاس بندی با دقت بالا است. این امر به ویژه در شرایطی که داده ها دارای پراکندگی نامتوازن باشند، پیچیدگی بیشتری پیدا می کند . مجموعه داده های نامتوازن سهم زیادی از مجموعه داده های جهان واقعی را تشکیل می دهند. نحوه برخورد با داده های نامتوازن به عنوان یک مسیله چالش برانگیز در داده کاوی شناخته می شود، به نحوی که شناسایی داده های رده کوچک تر با اشتباهات بسیاری روبرو استامروزه پردازش داده های نامتوازن، به دلیل گستردگی آنها در بسیاری از مسایل دنیای واقعی، مورد توجه محققان قرار گرفته است. به عنوان نمونه، مجموعه داده های نامتوازن اگر مربوط به اطلاعات افراد بیمار باشند، گروهی از این افراد که مبتلا به سرطان هستند جزء کلاس حداقلی می شوند و گروه اکثریت سالم هستند. بنابراین این حداقل داده ها در کل مجموعه افراد ممکن است در هنگام طبقه بندی به صورت سنتی، فرد سرطانی به عنوان فردی سالم دسته بندی شود و یا برعکس و یا دربررسی یک شبکه نفوذی فرد خاطی جزء داده های نویز در نظر گرفته شود و از مجموعه داده حذف شود. از بهترین روش های طبقه بندی داده های نامتوازن، ماشین بردار پشتیبان است. در این مقاله ما به چگونگی استفاده از ماشین بردار پشتیبان و استفاده از تابع کرنل می پردازیم و با توجه به مجموعه داده واقعی انتخاب شده چهار نوع کرنل مورد استفاده در ماشین بردار پشتیبان را ارزیابی می کنیم.

کلیدواژه ها:

نویسندگان

مریم عمادالدین

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، موسسه آموزش عالی غیرانتفاعی آبا

نسرین بدیع

استاد دانشگاه آزاد اسلامی واحد تهران جنوب

حمید خفاجه

هیات علمی موسسه آموزش عالی غیر انتغاعی آبا