براورد استوار نسبت به مشاهده های دورافتاده در رگرسیون خطی در حضور هم خطی چندگانه
- سال انتشار: 1396
- محل انتشار: دوفصلنامه اندیشه آماری، دوره: 22، شماره: 2
- کد COI اختصاصی: JR_ISS-22-2_009
- زبان مقاله: فارسی
- تعداد مشاهده: 240
نویسندگان
University of Tehran
University of Tehran
چکیده
یکی از عوامل تاثیرگذار در تحلیل آماری داده ها، وجود مشاهده های دورافتاده است. به روش هایی که تحت تاثیر مشاهده های دورافتاده قرار نمی گیرند، روش های آماری استوار گفته می شود. علاوه بر وجود مشاهده های دورافتاده، وجود وابستگی خطی میان متغیرهای پیشگو، که از آن با عنوان هم خطی چندگانه یاد می شود و نیز تعداد زیاد متغیرها در مقابل اندازه کم نمونه، به خصوص در مدل های تنک با بعد بالا، از دیگر مشکلاتی هستند که منجر به کاهش کارایی استنباط های حاصل از روش های کلاسیک رگرسیونی می شوند. در این مقاله، ابتدا معایب روش رگرسیونی کلاسیک کمترین توان های دوم در مقابل مشاهده های دورافتاده، هم خطی چندگانه و مدل های تنک را بررسی می کنیم. سپس به معرفی و بررسی روش های رگرسیون استوار و رگرسیون تاوانیده به عنوان راهکارهای حل این مشکلات می پردازیم. همچنین با در نظر گرفتن مشاهده های دورافتاده و هم خطی چندگانه و یا مدل های تنک به طور هم زمان به بررسی روش های رگرسیون استوار تاوانیده می پردازیم. در نهایت به منظور مقایسه عملکرد براوردگرهای مختلف مطرح شده در این مقاله، ابتدا سه مطالعه شبیه سازی را انجام داده و سپس به تحلیل یک مجموعه داده واقعی با استفاده از روش های رگرسیون استوار تاوانیده می پردازیم.کلیدواژه ها
Outliers, Robust regression, Multicollinearity, Sparse model, Penalized regression., مشاهده های دورافتاده, رگرسیون استوار, هم خطی چندگانه, مدل تنک, رگرسیون تاوانیده.اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.