ارائه یک مدل جمعی جدید برای مسائل طبقهبندی: ادغام تحلیل پوششی داده ها با یادگیری ماشین

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 71

فایل این مقاله در 27 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DEA16_087

تاریخ نمایه سازی: 4 اردیبهشت 1404

چکیده مقاله:

در مسائل طبقه بندی با مجموعه داده های بزرگ، استفاده از یک مدل طبقه بندی کننده منفرد ممکن است منجر به بیش برازش شود. برای مقابله با این مشکل، روش های یادگیری جمعی که از ترکیب چندین مدل طبقه بندی استفاده می کنند، اغلب عملکرد بهتری نسبت به انتخاب یک مدل منفرد بهینه دارند. با توجه به تنوع گسترده مدل های طبقه بندی موجود، چالش اساسی همچنان انتخاب مدل های طبقه بندی با باالترین کارایی برای یک مجموعه داده خاص است. بااینحال، اغلب روش های انتخاب مدل طبقه بندی صرفا بر ارزیابی عملکرد خروجی طبقه بندی تمرکز دارند و هزینه محاسباتی را در نظر نمی گیرند. این مقاله یک روش جدید یادگیری جمعی برای بهبود کیفیت طبقه بندی در مجموعه داده های حجیم، با بهره گیری از تحلیل پوششی داده ها ارائه می دهد. این روش شامل دو مرحله اصلی است: انتخاب طبقه بندهای کارا و ترکیب بهینه آنها. در مرحله اول، مجموعه ای از مدل های طبقه بندی متداول بر اساس دو معیار کلیدی ارزیابی می شوند: مصرف منابع محاسباتی و دقت خروجی طبقه بندی. برای این ارزیابی، از مدل بردار جهتی استفاده می شود که امکان تحلیل همزمان کارایی نسبی مدل ها را فراهم می کند. در نهایت، مدل هایی که دارای باالترین کارایی محاسباتی و عملکردی هستند، به عنوان طبقه بندهای منتخب تعیین می شوند. در مرحله دوم، ماتریس آشفتگی طبقه بندهای منتخب با استفاده از مدل کارایی متقاطع تحلیل می شود. سپس، ضرایب وزنی بهینه برای ترکیب این مدل ها تعیین می شود؛ به گونه ای که مدل هایی با عملکرد باالتر وزن بیشتری در ترکیب نهایی دریافت کنند. این تخصیص اوزان بر اساس مقادیر کارایی متقاطع، که نشان دهنده میزان اثربخشی نسبی هر مدل در مقایسه با سایر مدل های منتخب است، انجام می شود. نتایج آزمایش ها نشان می دهد که مدل کارایی متقاطع در مقایسه با مدل BCC و روش رای گیری مرجع، کارایی باالتری در ترکیب مدل های طبقه بندی دارد. علاوه بر این، روش پیشنهادی در مقایسه با سایر روش های موجود، به طور قابل توجهی منابع محاسباتی کمتری مصرف کرده و همزمان دقت باالتری در طبقه بندی ارائه می دهد.

کلیدواژه ها:

یادگیری جمعی ، تحلیل پوششی داده ها ، طبقه بند ، داده های بزرگ

نویسندگان

سارا مهران نیا

دانشجوی دکتری، ریاضی کاربردی، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران

فاطمه مهرگان

گروه ریاضی، واحد آبادان، دانشگاه آزاد اسلامی، آبادان، ایران