مطالعه ای بر روش های متوازن سازی در سطح داده ها در رویکردهای تحت یادگیری با نظارت

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,663

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECME05_034

تاریخ نمایه سازی: 13 بهمن 1398

چکیده مقاله:

با توسعه علوم داده ها به خصوص تکنیک های داده کاوی استفاده از رویکردهای تحت یادگیری با نظارت نیز گسترش یافته است. هنگامی که در یک فرایند داده کاوی مبتنی بر یادگیری با نظارت از یک مجموعه داده کاوی کلاس های با ماهیت فوق العاده نامتوازن استفاده می شود سوگیری بسیار از الگوریتم های داده کاوی نیز به سمت پیش بینی کلاس اکثریت متمایل می شود، این در حالی است که در چنین رویکردهایی عموما تشخیص صحیح برچسب کلاس اقلیت حائز اهمیت است. یکی از روش های حل مشکل فوق، استفاده از روش های متوازن سازی در سطح داده ها است که خود مبتنی بر روش های تحت Oversampling و Undersampling است. با توجه به اهمیت موضوع به نظر می رسد وجود یک پژوهش در راستای مطالعه جامع تر روش هی مذکور ضروری به نظر می رسد، در این پژوهش روش های متوازن سازی در سطح داده ها شامل Random over sampling و Random Under sampling و ADASYN و SMOTE به شکل جاع تر و با جزئیات بیشتری نسبت به مطالعات پیشین مورد بررسی و مطالعه قرار می گیرد.

کلیدواژه ها:

متوازن سازی داده ها ، SMOTE ، ADASYN ، Oversampling ، Undersampling

نویسندگان

احسان شفیعی نژاد

کارشناس ارشد مهندسی نرم افزار، دانشگاه رجاء