تنظیم مستقیم ماشین بردار پشتیبان برای دسته بندی مجموعه داده های نامتوازن

سعید, مفتاحی; محمد, طاهری; علی, حمزه

تنظیم مستقیم ماشین بردار پشتیبان برای دسته بندی مجموعه داده های نامتوازن

عنوان مقاله: تنظیم مستقیم ماشین بردار پشتیبان برای دسته بندی مجموعه داده های نامتوازن
شناسه ملی مقاله: CDI20_028
منتشر شده در بیستمین سمپوزیوم بین المللی هوش مصنوعی و پردازش سیگنال در سال 1402

مشخصات نویسندگان مقاله:

سعید مفتاحی - دانشجوی کارشناسی ارشد هوش مصنوعی و رباتیکز، دانشگاه شیراز
محمد طاهری - استادیار، دانشکده مهندسی و علوم کامپیوتر و فناوری اطلاعات دانشگاه شیراز
علی حمزه - استاد، دانشکده مهندسی و علوم کامپیوتر و فناوری اطلاعات دانشگاه شیراز

خلاصه مقاله:

یکی از چالش های مهم در زمینه داده کاوی مسئله دسته بندی مجموعه داده های نامتوازن است. به گونه ای که تعداد نمونه های یک کلاس از باقی کلاس ها کمتر است. همچنین یکی از مدل های دسته بندی، ماشین های بردار پشتیبان است که به دلیل رویکرد پهن حاشیه و تعمیم پذیری مناسبی که دارد از محبوبیت بالایی برخوردار است. در واقع این الگوریتم صحت عملکرد (Accuracy) را در کنار خطای ساختاری مدل بهینه می کند که در داده های نامتوازن، منجر به تضعیف دسته بندی داده های اقلیت می شود. یکی از شیوه های مقابله با عدم توازن بهینه کردن معیاری مانند F-Measure است که متناسب با شرایط عدم توازن طراحی شده است. از سوی دیگر خروجی مدل بردار پشتیبان بسیار وابسته به یک ضریب است که وظیفه تنظیم بین خطای تجربی و ساختاری را به عهده دارد. در این مقاله با بررسی مدل در تمام مسیر تنظیم، مقدار این ضریب مستقیما به گونه هایی تعیین می شود که عملکرد نهایی از منظر F-Measure روی داده های اعتبارسنجی بیشینه شود. پیچیدگی محاسباتی مدل نهایی به دست آمده از نتایج مطلوبی در مقایسه با روش های پایه روی تعدادی از مجموعه داده های نامتوازن برخوردار است.

کلمات کلیدی:

دسته بند کارا، ضریب تنظیم، ماشین بردار پشتیبان، داده های نامتوازن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1948254/