طبقه بندی اجماع با توجه به گوناگونی برای یادگیری داده های نامتعادل
محل انتشار: سومین کنگره بین المللی کامپیوتر، برق و مخابرات
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 768
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC03_011
تاریخ نمایه سازی: 6 اردیبهشت 1396
چکیده مقاله:
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روشهایی همچون داده کاویبرای استخراج دانش و اطلاعات نهفته در دادهها، امری غیرقابل اجتناب می باشد. مساله دیگری که امروزه در بحث داده-کاوی وجود دارد، بحث دادههای نامتعادل است. داده های نامتعادل می توانند توسط خطای اندازه گیری ایجاد شوند یاممکن است نتیجه نوع داده ی درونی باشند. بنابراین روشهای زیادی مانند نمونه برداری، یادگیری حساس به هزینه،bagging و boosting مبتنی بر روشهای جمعی ارایه شده است ولی این روشها باعث حذف بعضی داده های مفید یاافزودن داده اضافی می شوند بنابراین بر آن شدیم که روشی جدید ارایه کنیم که بر مشکلات روشهای قبلی غلبه کند.در روش پیشنهادی ابتدا کلاس داده دودویی نامتعادل را به چندین کلاس داده دودویی متعادل تبدیل می کند. این کار رابا بکارگیری تقسیم تصادفی یا خوشه بندی نمونه های کلاس اکثریت انجام می دهد. بعد از آن یک الگوریتم طبقه بندیخاص بکار می رود تا چندین داده دودویی متعادل را به چندین طبقه بند تبدیل کند سرانجام نتایج طبقه بندی، این طبقهبند های دودویی را برای یک داده جدید با پنج قانون جمعی جدید شامل MaxDistance ، MinDistance ،ProDistance ، MajDistance و SumDistance ترکیب می کند سپس با توجه به گوناگونی روی طبقه بندجمعی رابطه بین داده جدید و داده قدیمی را شرح می دهد.نتایج آزمایشات روی 64 مجموعه داده نامتعادل نشان می دهد که روش ارایه شده قادر است مسایل کلاس دادهدودویینامتعادل را مدیریت کند و معمولا از روشهای مرسوم شامل روشهای مدیریت داده نامتعادل داخلی و خارجی موثرترعمل می کند.
کلیدواژه ها:
نویسندگان
مصطفی بصیرنژاد
دانشکده فنی و مهندسی، موسسه آموزش عالی خراسان
صادق کمالیان
دانشجوی مرکز آموزش علمی کاربردی مدیریت صنعتی خراسان رضوی
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :