مروری برتکنیک های فیلترینگ درجهت کاهش ابعادکلان داده

  • سال انتشار: 1394
  • محل انتشار: کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر
  • کد COI اختصاصی: COMCONF01_377
  • زبان مقاله: فارسی
  • تعداد مشاهده: 696
دانلود فایل این مقاله

نویسندگان

سمیرا پگاهان

دانشجوی کارشناسی ارشددانشکده مهندسی کامپیوتر واحد نجف آباد دانشگاه آزاد اسلامی نجف آباد ایران

محمدحسین ندیمی

استادیار دانشکده مهندسی کامپیوتر واحد نجف آباد دانشگاه آزاد اسلامی نجف آباد ایران

اکبر معظم

دانشجوی کارشناسی ارشددانشکده مهندسی کامپیوتر واحد دولت آباد دانشگاه آزاد اسلامی دولت آباد ایران

چکیده

داده های کلان پدیده ای درحال وقوع است که ازسال 2003تا2008 تولید داده توسط بشریت از5اگزابایت سه برابر شده و به 14.7 اگزابایت رسیده است ازانجا که حجم سرعت تنوع و پیچیدگی مجموعه داده به طور مداوم رو به افزایش می باشد یادگیری ماشین اموزش تکنیک هایی را به منظور استخراج مقداربسیارعظیمی ازاطلاعات ضروری دانسته و با رشد پیچیدگی و مقادیر کلان داده ها و ظهور ابعادبالای آن شناسایی مناسب پارامترهای مرتبط با ابعادبالای داده دردنیای واقعی به امری ضروری تبدیل شده است اگرچه با دردسترس بودن الگوریتم های گسترده روشهای انتخاب ویژگی مناسب اسان نمی باشد و لازم است تاثیرات آن درزمینه های مختلف بررسی شود همچنین ارزیابی ویژگیهای متفاوت درمجموعه داده های واقعی درابعاد بالا دشوار می باشد دراین مقاله نتایج عملکرد روشهای مختلف انتخاب ویژگی و روشهای filters تک متغیره یا چندمتغیره که مجموعه ای ازویژگی ها یاپارامترهای رتبه بندی شده را باز می گرداند بررسی خواهد شد بنابراین بااین مطالعه قادر به انتخاب روشهای filters مناسب خواهیم بود

کلیدواژه ها

انتخاب ویژگی ، ابعادبالای داده

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.