ارائه یک مدل جمعی جدید برای مسائل طبقهبندی: ادغام تحلیل پوششی داده ها با یادگیری ماشین

  • سال انتشار: 1403
  • محل انتشار: شانزدهمین کنفرانس بین المللی تحلیل پوششی داده ها و علوم تصمیم گیری
  • کد COI اختصاصی: DEA16_087
  • زبان مقاله: فارسی
  • تعداد مشاهده: 74
دانلود فایل این مقاله

نویسندگان

سارا مهران نیا

دانشجوی دکتری، ریاضی کاربردی، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران

فاطمه مهرگان

گروه ریاضی، واحد آبادان، دانشگاه آزاد اسلامی، آبادان، ایران

چکیده

در مسائل طبقه بندی با مجموعه داده های بزرگ، استفاده از یک مدل طبقه بندی کننده منفرد ممکن است منجر به بیش برازش شود. برای مقابله با این مشکل، روش های یادگیری جمعی که از ترکیب چندین مدل طبقه بندی استفاده می کنند، اغلب عملکرد بهتری نسبت به انتخاب یک مدل منفرد بهینه دارند. با توجه به تنوع گسترده مدل های طبقه بندی موجود، چالش اساسی همچنان انتخاب مدل های طبقه بندی با باالترین کارایی برای یک مجموعه داده خاص است. بااینحال، اغلب روش های انتخاب مدل طبقه بندی صرفا بر ارزیابی عملکرد خروجی طبقه بندی تمرکز دارند و هزینه محاسباتی را در نظر نمی گیرند. این مقاله یک روش جدید یادگیری جمعی برای بهبود کیفیت طبقه بندی در مجموعه داده های حجیم، با بهره گیری از تحلیل پوششی داده ها ارائه می دهد. این روش شامل دو مرحله اصلی است: انتخاب طبقه بندهای کارا و ترکیب بهینه آنها. در مرحله اول، مجموعه ای از مدل های طبقه بندی متداول بر اساس دو معیار کلیدی ارزیابی می شوند: مصرف منابع محاسباتی و دقت خروجی طبقه بندی. برای این ارزیابی، از مدل بردار جهتی استفاده می شود که امکان تحلیل همزمان کارایی نسبی مدل ها را فراهم می کند. در نهایت، مدل هایی که دارای باالترین کارایی محاسباتی و عملکردی هستند، به عنوان طبقه بندهای منتخب تعیین می شوند. در مرحله دوم، ماتریس آشفتگی طبقه بندهای منتخب با استفاده از مدل کارایی متقاطع تحلیل می شود. سپس، ضرایب وزنی بهینه برای ترکیب این مدل ها تعیین می شود؛ به گونه ای که مدل هایی با عملکرد باالتر وزن بیشتری در ترکیب نهایی دریافت کنند. این تخصیص اوزان بر اساس مقادیر کارایی متقاطع، که نشان دهنده میزان اثربخشی نسبی هر مدل در مقایسه با سایر مدل های منتخب است، انجام می شود. نتایج آزمایش ها نشان می دهد که مدل کارایی متقاطع در مقایسه با مدل BCC و روش رای گیری مرجع، کارایی باالتری در ترکیب مدل های طبقه بندی دارد. علاوه بر این، روش پیشنهادی در مقایسه با سایر روش های موجود، به طور قابل توجهی منابع محاسباتی کمتری مصرف کرده و همزمان دقت باالتری در طبقه بندی ارائه می دهد.

کلیدواژه ها

یادگیری جمعی, تحلیل پوششی داده ها, طبقه بند, داده های بزرگ

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.