طبقه بندی داده های چند برچسبی با استفاده از درخت خوشه بندی به همراه الگوریتم فازی میانگین C

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 229

فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIORS14_115

تاریخ نمایه سازی: 12 دی 1400

چکیده مقاله:

امروزه یکی از پرکاربردترین حوزه های یادگیری ماشین، طبقه بندی داده ها می باشد. داده ها به دو صورت تک برچسبی و چند برچسبی وجود دارند. داده های چند برچسبی به داده هایی گفته می شود که در آن برخلاف داده های تک برچسبی، هر نمونه می تواند متعلق به چند کلاس باشد. در سال های اخیر، به دلیل رشد روزافزون کاربردهای این داده ها، طبقه بندی داده های چند برچسبی توجه بسیاری از محققان را به خود جلب کرده است. الگوریتم های طبقه بندی چند برچسبی به ۳ دسته کلی تقسیم بندی می شوند: روش های تبدیل مسئله، روش های انطباق الگوریتم و روش های گروهی. در روش های تبدیل مسئله، طبقه بندی داده های چند برچسبی به حوزه های دیگر انتقال می یابد، درحالی که در دسته دوم الگوریتم های معروف را جهت کار کردن با داده های چند برچسبی تغییر و تطبیق می دهند. روش های گروهی نیز همان طور که از اسمشان پیداست، ترکیبی از روش های دو دسته قبل می باشند. عملکرد طبقه بند، پیدا کردن برچسب های مرتبط و وجود داده های پرت و نویز دار همواره از چالش های مسائل طبقه بندی چند برچسبی بوده است. بنابراین در این مقاله سعی بر این است با ارائه یک سیستم متشکل از خوشه بند Isolation Forest جهت حذف داده های پرت و یک روش گروهی از ترکیب درخت خوشه بندی پیش بینی کننده با الگوریتم فازی میانگین C و همچنین بهره گیری از یک الگوریتم بهینه سازی چند هدفی، عملکرد طبقه بند چند برچسبی نسبت به دیگر روش ها در یک یا چند معیار بهبود پیدا کند. نتایج آزمایش ها نشان دهنده برتری روش پیشنهادی در مجموعه داده های مختلف از نظر معیار LRAP و F۱ نسبت به روش های مرز دانش است.

کلیدواژه ها:

داده های چند برچسبی ، طبقه بندی ، الگوریتم فازی میانگین c ، درخت خوشه بندی ، یادگیری گروهی ، داده های پرت.

نویسندگان

محمدعلی ظریف

دانشجوی کارشناسی ارشد هوش مصنوعی، دانشگاه سجاد

جواد حمیدزاده

دانشیار دانشگاه، دانشگاه سجاد