CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

انواع روشهای ردهبندی دادههای نامتوازن و مزایا و معایب آنها

عنوان مقاله: انواع روشهای ردهبندی دادههای نامتوازن و مزایا و معایب آنها
شناسه ملی مقاله: CECA03_008
منتشر شده در سومین همایش ملی برق و کامپیوتر امین در سال 1396
مشخصات نویسندگان مقاله:

هادی مهدوی نیا - دانشگاه آزاد اسلامی، واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران
اعظم ربیعی - باشگاه پژوهشگران جوان و نخبگان، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران

خلاصه مقاله:
در مواجهه با مجموعه دادهها برای ردهبندی آنها، از نظر توازن، دو نوع داده مشاهده میشود: 1 - دادههای متوازن 1 2 - دادههای نامتوازن 2 . برای ردهبندی دادههای نامتوازن، اگر از روشها و فنون مرسوم و پیشین استفاده شود، مشکلاتی از قبیل: استخراج مدل جانبدارانهی متمایل بهدادههای آموزشی، ردهبندی اشتباه ردهی اقلیت 3 ، صرفنظر کردن از دادههای ردهی اقلیت و بیشپوشش 4 به وجود خواهد آمد؛ بنابراین باید از فنون خاصی برای ردهبندی دادههای نامتوازن استفاده شود. برای ردهبندی دادههای نامتوازن، از رویکرد سطح داده 5 ، رویکرد سطح الگوریتم 6 ،رویکرد یادگیری حساس به هزینه 7 یا رویکرد یادگیری گروهی 8 ، استفاده میشود که با توجه به مجموعهی دادهها و اهداف مورد نظر، یکی از رویکردها انتخاب میشود. در این تحقیق انواع روشهای ردهبندی مجموعه دادههای نامتوازن، و همچنین مزایا و معایب هر کدام بررسی میشوند

کلمات کلیدی:
دادههای نامتوازن، رده اکثریت 9 ، رده اقلیت، ردهبندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/642349/