طبقه بندی داده های نامتعادل با ترکیب دو تکنیک نمونه زدایی و نمونه افزایی

  • سال انتشار: 1394
  • محل انتشار: دومین کنگره بین المللی فن آوری، ارتباطات و دانشICTCK۲۰۱۵
  • کد COI اختصاصی: ICTCK02_064
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1625
دانلود فایل این مقاله

نویسندگان

فرزانه ایوبی مهریزی

دانشجوی کارشناسی ارشد دانشگاه امام رضا

عادل قاضی خانی

استادیار گروه کامپیوتر دانشگاه امام رضا

چکیده

طبقه بندی داده های نامتعادل یکی از مسائل مورد توجه در جامعه تحقیقاتی یادگیری ماشین و تشخیص الگو است. دادهنامتعادل دادهای است که در آن در یک کلاس که معمولا اهمیت بیشتری دارد داده بسیار اندک است. یکی از روشهایبرخورد با عدم تعادل پیش پردازش داده ها به دو شکل نمونه زدایی و نمونه افزایی است. نمونها فزایی مشکل یادگیریافزونه و نمونه زدایی مشکل حذف داده های با اهمیت را دارد. در این تحقیق روشی ترکیبی مبتنی بر نمونه زدایی و نمونهافزایی ارائه می شود.نتایج بر روی داده های استاندارد نشان می دهد که این روش در مقایسه با چند روش مشابه با معیار AUC نتایج را بهبود داده است.

کلیدواژه ها

طبقه بندی؛ داده های نامتعادل؛ نمونه زدایی؛ نمونه افزایی؛ الگوریتم های تکاملی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.