الگوریتم های طبقه بندی کلان داده های نامتعادل

  • سال انتشار: 1394
  • محل انتشار: دومین کنفرانس بین المللی و سومین همایش ملی کاربرد فناوری های نوین در علوم مهندسی
  • کد COI اختصاصی: ITCC02_270
  • زبان مقاله: فارسی
  • تعداد مشاهده: 933
دانلود فایل این مقاله

نویسندگان

وحید فاضلی نیا

دانشجوی کارشناسی ارشد، کامپیوتر نرمافزار، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران

عادل قاضی خانی

عضو هیئت علمی، کامپیوتر نرمافزار، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران

پوریا محمدعلمی

دانشجوی کارشناسی ارشد، کامپیوتر نرمافزار، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران

چکیده

با افزایش روش به رشد نمایی داده ها و حجم بزرگی از آنها که به وجود آمده است، روز به روز نیاز به پردازش وتحلیل این داده های کلان بیشتر می شود. طبقه بندی داده ها، شکلی از تحلیل داده ها تلقی می شود، که در آنمدل هایی جهت توصیف کلاس های مهمی از داده ها استخراج می شود. طبقه بندی مجموعه داده های نامتعادل ،چالشی را برای اکثر تلنیک های یادگیری استاندارد به وجود آورده است و الگوریتم ها، تحت تاثیر منفی توزیعکلاس نامتعادل قرار گرفته است. در این کار، به بررسی روش های مختلف طبقه بندی کلان داده های نامتعادل باالگوریتم های مختلفی از جمله تعدیل نمونه، الگوریتم های تکاملی و غیره پرداخته شده است. نتایج در مقالات بااستفاده از روش های ارزیابی مختلف مورد مقایسه قرار گرفته اند.

کلیدواژه ها

کلان داده ها، نگاشت کاهش، مجموعه داده های نامتاادل، یادگیری ماشین، طبقه بندی داده ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.