انتخاب متغیر در داده های بزرگ

سعید محمدی; داود شاهسونی; حسین باغیشنی

انتخاب متغیر در داده های بزرگ

محل انتشار: نخستین کنفرانس ملی محاسبات نرم

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 718

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/656636

شناسه ملی سند علمی:

CSCG01_126

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

فناوری های نوین، داده های حجیمی را در بعد بالا تولید می کنند که مسیله تحلیل آنها موجب ابداع روش های جدید آماری و یادگیری ماشین شده است. قبل از اعمال بسیاری از این روش ها، معمول است که بعد داده های اصلی توسط روش هایی نظیر تحلیل مولفه های اصلی، رده بندی های درخت تصمیم، لاسو و غیره کاهش داده شده و متغیرهای موثر شناسایی شوند؛ اما در مواجهه با داده های بزرگ در بعد بالا، بسیاری از این روش ها به دلیل حجم و پیچیدگی محاسباتی قابل اجرا نیستند؛ بنابرین نیاز به الگوریتم های کار آمد است. در این تحقیق، با به کارگیری رویکرد غربال گری مستقل مطمین ابتدا متغیرهای موثر شناسایی شده سپس با این مجموعه متغیرها، عملکرد چهار روش رده بندی؛ تحلیل ممیزی خطی، تحلیل ممیزی درجه دوم، 1– نزدیک ترین همسایگی و رگرسیون لجستیک برای یک داده واقعی بررسی شده و نتایج باهم مقایسه شده اند.

کلیدواژه ها:

غربالگری مستقل مطمین ، تحلیل ممیزی خطی ، تحلیل ممیزی درجه دوم ، 1– نزدیکترین همسایگی

نویسندگان

سعید محمدی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود

داود شاهسونی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود

حسین باغیشنی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود