طبقه بندی اجماع با توجه به گوناگونی برای یادگیری داده های نامتعادل

مصطفی بصیرنژاد; صادق کمالیان

طبقه بندی اجماع با توجه به گوناگونی برای یادگیری داده های نامتعادل

محل انتشار: سومین کنگره بین المللی کامپیوتر، برق و مخابرات

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,018

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/576101

شناسه ملی سند علمی:

ITCC03_011

تاریخ نمایه سازی: 6 اردیبهشت 1396

چکیده مقاله:

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روشهایی همچون داده کاویبرای استخراج دانش و اطلاعات نهفته در دادهها، امری غیرقابل اجتناب می باشد. مساله دیگری که امروزه در بحث داده-کاوی وجود دارد، بحث دادههای نامتعادل است. داده های نامتعادل می توانند توسط خطای اندازه گیری ایجاد شوند یاممکن است نتیجه نوع داده ی درونی باشند. بنابراین روشهای زیادی مانند نمونه برداری، یادگیری حساس به هزینه،bagging و boosting مبتنی بر روشهای جمعی ارایه شده است ولی این روشها باعث حذف بعضی داده های مفید یاافزودن داده اضافی می شوند بنابراین بر آن شدیم که روشی جدید ارایه کنیم که بر مشکلات روشهای قبلی غلبه کند.در روش پیشنهادی ابتدا کلاس داده دودویی نامتعادل را به چندین کلاس داده دودویی متعادل تبدیل می کند. این کار رابا بکارگیری تقسیم تصادفی یا خوشه بندی نمونه های کلاس اکثریت انجام می دهد. بعد از آن یک الگوریتم طبقه بندیخاص بکار می رود تا چندین داده دودویی متعادل را به چندین طبقه بند تبدیل کند سرانجام نتایج طبقه بندی، این طبقهبند های دودویی را برای یک داده جدید با پنج قانون جمعی جدید شامل MaxDistance ، MinDistance ،ProDistance ، MajDistance و SumDistance ترکیب می کند سپس با توجه به گوناگونی روی طبقه بندجمعی رابطه بین داده جدید و داده قدیمی را شرح می دهد.نتایج آزمایشات روی 64 مجموعه داده نامتعادل نشان می دهد که روش ارایه شده قادر است مسایل کلاس دادهدودویینامتعادل را مدیریت کند و معمولا از روشهای مرسوم شامل روشهای مدیریت داده نامتعادل داخلی و خارجی موثرترعمل می کند.

کلیدواژه ها:

داده کاوی ، طبقه بندی اجماع ، داده های نامتعادل ، گوناگونی

نویسندگان

مصطفی بصیرنژاد

دانشکده فنی و مهندسی، موسسه آموزش عالی خراسان

صادق کمالیان

دانشجوی مرکز آموزش علمی کاربردی مدیریت صنعتی خراسان رضوی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Z. Sun, Q. Song, X. Zhu, Using coding-based ensemble learning ...
D. Thammasiri, D. Delen, P. Meesad, N. Kasap, A critical ...
W. Fan, S. J. Stolfo, J. Zhang, et al., "AdaCost: ...
Y.C. Tang, Y.-Q. Zhang, N. V. Chawla, et al., "SVMs ...
L. Zhuang and H. Dai, "Parameter estimation of one-class SVM ...
N. V. Chawla, K. W. Bowyer, L. O. Hall, W. ...
Y. Freund, R. Schapire, Experiments with a new boosting algorithm, ...
N. Tomasev, D. Mladeni c, Class imbalance and the curse ...
M. A. Tahir, J. Kittler, F. Yan, Inverse random under ...
V. Garc na, J. S. S anchez, R. Mart n-F'elez, ...
Z. Sun, Q. Song, X. Zhu, H. Sun, B. Xu, ...
G.-Z. Li, H.-H. Meng, W.-C. Lu, et al, "Asymmetric bagging ...
C. G.-Z. Li, H.-H. Meng, W.-C "Classifying imbalanced data using ...
S. Hido, H. Kashima, and Y. Takahashi, "Roughly balanced bagging ...
Y. Sun, M.S. Kamel, A.K.C. Wong, et al., "Cost-sensitie boosting ...
N. V. Chawla, A. Lazarevic, L. O. Hall, et al., ...
C. Seiffert, T. M. Khoshgoftaar, J. V. Hulse, et al., ...
H. Guo and H.L Viktor, "Learning from imbalanced data sets ...
C. Elkan, "The foundations of cost-sensitive learring, " Proc. 17th ...
H. He and E. A. Garcia, "Learning from imbalanced data, ...
Z.-H. Zhou and X.-Y. Liu, "Training cost-sensitive neural networks with ...
P. Domingos, "MetaCost: A general method for making classifiers cost-sensitive, ...
X. Liu, J.Wu, Z. Zhou, Exploratory undersampling for class -imbalance ...
A. Fern andez, M. J. del Jesus, F. Herrera, On ...
J. Alcal a, A. Fern andez, J. Luengo, J. Derrac, ...
M. Friedman, The use of ranks to avoid the assumption ...
J. Dem sar, Statistical comparisons of classifiers over multiple data ...
P. Nemenyi, D istribution-fre multiple comparisons, Ph.D. thesis, Princeton, 1963. ...

نمایش کامل مراجع