کاهش بعد داده ها به شیوه غربالگری

  • سال انتشار: 1400
  • محل انتشار: چهارمین کنفرانس بین المللی محاسبات نرم
  • کد COI اختصاصی: CSCG04_180
  • زبان مقاله: فارسی
  • تعداد مشاهده: 472
دانلود فایل این مقاله

نویسندگان

محمد کاظمی

استادیار گروه آمار، دانشگاه گیلان

چکیده

در تحلیل داده های با بعد بسیار بالا، شناسایی متغیرهای توضیحی موثر بر پاسخ، از اهمیت بسزایی برخوردار است. در این نوع داده ها، ابتدا با استفاده از یک روش غربالگری تعداد متغیرهای توضیحی را کاهش داده و سپس از روش های انتخاب متغیر مبتنی بر جریمه برای انتخاب مدل نهایی استفاده می کنیم. در این مقاله به مروری بر چند روش غربالگری رایج پرداخته می شود. این روش ها شامل غربالگری مستقل مطمئن ( SIS )، غربالگری و رتبه بندی مستقل مطمئن ( SIRS ) و غربالگری مستقل مطمئن براساس همبستگی فاصله ای ( DC-SIS ) می باشند. پس از معرفی این روش ها، با استفاده شبیه سازی، توانایی آنها در انتخاب متغیرهای مهم با هم مقایسه می کنیم. نتایج مطالعات شبیه سازی نشان می دهد که روش DC-SIS در مقایسه با دو روش دیگر، از قابلیت بیشتری در تشخیص متغیرهای مهم برخوردار است، به ویژه هنگامی که برخی از متغیرهای توضیحی دارای اثر غیرخطی بر متغیر پاسخ باشند

کلیدواژه ها

انتخاب متغیر، داده های بعد بالا، غربالگری مستقل مطمئن، کاهش بعد، رتبه بندی متغیرها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.