انتخاب متغیر در داده های بزرگ
محل انتشار: نخستین کنفرانس ملی محاسبات نرم
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 702
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSCG01_126
تاریخ نمایه سازی: 29 مهر 1396
چکیده مقاله:
فناوری های نوین، داده های حجیمی را در بعد بالا تولید می کنند که مسیله تحلیل آنها موجب ابداع روش های جدید آماری و یادگیری ماشین شده است. قبل از اعمال بسیاری از این روش ها، معمول است که بعد داده های اصلی توسط روش هایی نظیر تحلیل مولفه های اصلی، رده بندی های درخت تصمیم، لاسو و غیره کاهش داده شده و متغیرهای موثر شناسایی شوند؛ اما در مواجهه با داده های بزرگ در بعد بالا، بسیاری از این روش ها به دلیل حجم و پیچیدگی محاسباتی قابل اجرا نیستند؛ بنابرین نیاز به الگوریتم های کار آمد است. در این تحقیق، با به کارگیری رویکرد غربال گری مستقل مطمین ابتدا متغیرهای موثر شناسایی شده سپس با این مجموعه متغیرها، عملکرد چهار روش رده بندی؛ تحلیل ممیزی خطی، تحلیل ممیزی درجه دوم، 1– نزدیک ترین همسایگی و رگرسیون لجستیک برای یک داده واقعی بررسی شده و نتایج باهم مقایسه شده اند.
کلیدواژه ها:
نویسندگان
سعید محمدی
گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود
داود شاهسونی
گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود
حسین باغیشنی
گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود