A new hybrid method for data analysis when a significant percentage of data is missing
محل انتشار: مجله ابرساختارها، دوره: 13، شماره: 2
سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 121
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JHSMS-13-2_012
تاریخ نمایه سازی: 24 آذر 1403
چکیده مقاله:
This article aims to compare the efficiency of different imputation methods with missing data. In this way we use mean, median, Expected-Maximization (EM), regression imputation(RI) and multiple imputations (MI) to replace missing data.In fact, we employ three proposed combination methods, namely EM imputation with MI imputation (EMMI), EM imputation with regression imputation (EMR), and regression imputation with MIimputation (MI). In this paper, we compare these methods using an example study of Waterborne Container Trade by the US Customs Port (۲۰۰۰-۲۰۱۷) where the methods with different missing percent-ages. Several criteria, are used to compare estimations efficiency, such as mean, Standard Deviation (SD), and Mean Squared Error (MSE). The results show that the efficiency of composite imputation methods in almost all situations, in terms of MSE, RMI imputation method outperforms other methods. Nevertheless, when the missing percentage is small, the EMR imputation method performs better. In terms of the SD criterion, we find that the MI method is better than the other methods, where the RMI method is good when the missing percentage is large. When the missing percentage is in the range (۴۰-۵۰%), the EMR and RMI imputation methods give a better MSE.
کلیدواژه ها:
نویسندگان
Behrouz Fathi-Vajargah
Department of Statistics, Faculty of Mathematical Sciences, University of Guilan, Rasht, Iran
Ahmad Nouraldin
Dep. of Applied Maths, University of Guilan, Rasht, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :