تنظیم مستقیم ماشین بردار پشتیبان برای دسته بندی مجموعه داده های نامتوازن

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 41

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CDI20_028

تاریخ نمایه سازی: 18 فروردین 1403

چکیده مقاله:

یکی از چالش های مهم در زمینه داده کاوی مسئله دسته بندی مجموعه داده های نامتوازن است. به گونه ای که تعداد نمونه های یک کلاس از باقی کلاس ها کمتر است. همچنین یکی از مدل های دسته بندی، ماشین های بردار پشتیبان است که به دلیل رویکرد پهن حاشیه و تعمیم پذیری مناسبی که دارد از محبوبیت بالایی برخوردار است. در واقع این الگوریتم صحت عملکرد (Accuracy) را در کنار خطای ساختاری مدل بهینه می کند که در داده های نامتوازن، منجر به تضعیف دسته بندی داده های اقلیت می شود. یکی از شیوه های مقابله با عدم توازن بهینه کردن معیاری مانند F-Measure است که متناسب با شرایط عدم توازن طراحی شده است. از سوی دیگر خروجی مدل بردار پشتیبان بسیار وابسته به یک ضریب است که وظیفه تنظیم بین خطای تجربی و ساختاری را به عهده دارد. در این مقاله با بررسی مدل در تمام مسیر تنظیم، مقدار این ضریب مستقیما به گونه هایی تعیین می شود که عملکرد نهایی از منظر F-Measure روی داده های اعتبارسنجی بیشینه شود. پیچیدگی محاسباتی مدل نهایی به دست آمده از نتایج مطلوبی در مقایسه با روش های پایه روی تعدادی از مجموعه داده های نامتوازن برخوردار است.

نویسندگان

سعید مفتاحی

دانشجوی کارشناسی ارشد هوش مصنوعی و رباتیکز، دانشگاه شیراز

محمد طاهری

استادیار، دانشکده مهندسی و علوم کامپیوتر و فناوری اطلاعات دانشگاه شیراز

علی حمزه

استاد، دانشکده مهندسی و علوم کامپیوتر و فناوری اطلاعات دانشگاه شیراز