بررسی و بهبود روشی برای مسائل عدم تعادل کلاس بندی مجموعه داده های نامتوازن

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 870

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF01_030

تاریخ نمایه سازی: 22 آبان 1395

چکیده مقاله:

امروزه مسئله کلاس بندی داده های نامتوازن از اهمیت خاصی برخوردار است. کلاس بندی این داده ها بدین گونه است که، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد کلاس اقلیت oversampling نامیده می شود و شامل تعداد حالات کمتری نسبت به کلاس اکثریت undersampling می باشد. سعی می شود در کلاس بندی این داده ها، تعداد حالات کلاس اقلیت را نسبت به کلاس اکثریت افزایش دهیم. در این مقاله، روشی برای نمونه برداری نیمه بدون نظارت وزن دار وفقی (A-SUWO) را برای بهبود طبقه بندی مجموعه داده های باینری نامتوازن ارائه و بررسی می کنیم. این روش با استفاده از خوشه بندی سلسه مراتبی بدون نظارت وزن و اندازه قابل تطبیق به oversampling هریک از زیر خوشه ها با استفاده از پیچیدگی کلاس بندی و اعتبار سنجی متقابل می پردازد، سپس نمونه های اقلیت بسته به فاصله اقلیدسی خود نسبت به کلاس اکثریت، طبقه بندی می شوند.

نویسندگان

اسماعیل صادقی هفشجانی

دانشگاه آزاد اسلامی شهرکرد

زهره صحرانشین سامانی

دانشگاه آزاد اسلامی شهرکرد

شیرین بنی طالبی

دانشگاه آزاد اسلامی شهرکرد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :