جانشینی مقادیر گمشده و تاثیر آن بر خطای کلاسه بندی

حمیدرضا طهماسبی; ملیحه آموزگار; حسن قائدی

جانشینی مقادیر گمشده و تاثیر آن بر خطای کلاسه بندی

محل انتشار: کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 568

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/451215

شناسه ملی سند علمی:

ITCC01_428

تاریخ نمایه سازی: 9 فروردین 1395

چکیده مقاله:

اجتناب از داده های گمشده در مجموعه داده های واقعی، حتی اگر نهایت دقت هم در جمع آوریداده ها بشود، باز هم غیرممکن است. این مقادیر می توانند تمام فرایند داده کاوی و تفسیرهایحاصل را تحت تاثیر قرار دهند. اکثر الگوریتم های داده کاوی با این فرض طراحی شده اند که هیچمقدار گمشدهای در مجموعه داده ها وجود ندارد. بنابراین برخورد با مقادیر گمشده می تواند بطورقابل ملاحظه ای کیفیت داده کاوی را افزایش دهد. در این مقاله، تاثیر روش های معروف جانشینیمقادیر گمشده شامل KNN, Hot Deck, Mean/Mode و Multiple Imputation برروی دقت و خطای کلاسه بندی با آزمایش بر روی ده مجموعه داده با کاربردهای مختلف موردمقایسه و ارزیابی قرار می گیرند. آزمایشات بر روی شش نرخ مختلف از مقادیر گمشده انجام میگیرند. این مجموعه داده ها در اندازه، تعداد مقادیر گمشده، و انواع داده های اسمی و عددی متفاوتمی باشند. در آزمایشات از پنج کلاسه بند معروف نزدیکترین k همسایه، بیزین ساده، مبتنی برقاعده ی RIPPER و ماشین بردار پشتیبان استفاده می شود.

کلیدواژه ها:

مقادیر گمشده ، جانشینی مقادیر گمشده ، کلاسه بندی

نویسندگان

حمیدرضا طهماسبی

مربی، عضو هیات علمی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران

ملیحه آموزگار

مربی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران

حسن قائدی

مربی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

_ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
Acuna, E., & Rodriguez, C. (2004). The treatment of missing ...
Batista, G. E. a. P. a., & Monard, M. C. ...
Farhangfar, A., Kurgan, L. A., & Pedrycz, W. (2004). Experimental ...
Farhangfar, A., Kurgan, L, & Dy, J. (2008). Impact of ...
Kang, P. (2013). Locally linear reconstruction based missing value imputation ...
Lobato, F., Sales, C., Araujo, I., Tadaiesky, V., Dias, L., ...
Munirah, Y. (2011). The Impact of Missing Value Methods and ...
Olamiti, a O., & Osofisan, A. O. (2009). Experimental Comparison ...
Peng, L., & Lei, L. (2005). A Review of Missing ...
Rahman, M. G., & Islam, M. Z. (2014). FIMUS: A ...
Silva, J. D. A., & Hruschka, E. R. (2013). An ...
Silva-Ramirez, E. L., Pino-Mejias, R., Lopez-Coello, M., & Cub ile ...
S omasundaram, R. S., & N edunchezhian, R. (2011). Evaluation ...
Suthar, B., Patel, H., & Goswami, A. (2012). A Survey ...
UCI Machine Learning Repository. Retrieved March 20, 2015, from du/-mle ...
Vinod, N. C., & Punithavalli, M. (2011). Classification of incomplete ...
Zhang, S. (2011). Shell-neighbor method and its application in missing ...
Zhu, B., He, C., & Liatsis, P. (2012). A robust ...

نمایش کامل مراجع