A heuristic algorithm to combat outliers and multicollinearity in regression model analysis

  • سال انتشار: 1401
  • محل انتشار: مجله ایرانی آنالیز عددی و بهینه سازی، دوره: 12، شماره: 1
  • کد COI اختصاصی: JR_IJNAO-12-1_009
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 260
دانلود فایل این مقاله

نویسندگان

M. Roozbeh

Faculty of Mathematics, Statistics and Computer Science, P.O. Box: ۳۵۱۹۵-۳۶۳, Semnan University, Semnan, Iran.

S. Babaie-Kafaki

Faculty of Mathematics, Statistics and Computer Science, P.O. Box: ۳۵۱۹۵-۳۶۳, Semnan University, Semnan, Iran.

M. Manavi

Faculty of Mathematics, Statistics and Computer Science, Semnan University, Semnan, Iran

چکیده

As known, outliers and multicollinearity in the data set are among the important diffculties in regression models, which badly affect the leastsquares estimators. Under multicollinearity and outliers’ existence in the data set, the prediction performance of the least-squares regression method is decreased dramatically. Here, proposing an approximation for the condition number, we suggest a nonlinear mixed-integer programming model to simultaneously control inappropriate effects of the mentioned problems. The model can be effectively solved by popular metaheuristic algorithms. To shed light on importance of our optimization approach, we make some numerical experiments on a classic real data set as well as a simulated data set.

کلیدواژه ها

Condition number, linear regression, Penalty method, Metaheuristic algorithm, Nonlinear mixed-integer programming

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.