چگونگی تلخیص داده ها(کاهش بعد) در فرآیند داده کاوی
- سال انتشار: 1397
- محل انتشار: کنگره بین المللی علوم مهندسی و توسعه شهری پایدار
- کد COI اختصاصی: DTUCONF01_237
- زبان مقاله: فارسی
- تعداد مشاهده: 1376
نویسندگان
عضو هییت علمی و استاد تمام دانشگاه لیوزویل آمریکا
عضو هییت علمی دانشگاه آزاد, دانشجوی دکتری دانشگاه امیرکبیر
چکیده
گام های پیش پردازش به عنوان آماده سازی داده ها برای داده کاوی در مورد مجموعه های دادهای کوچک ومتوسط،کافی میباشند. برای مجموعه های دادهای بسیار بزرگ، امکان افزودن یک گام اضافی و میانی، تلخیص داده ها، که پیش از به کارگیری فنون داده کاوی بایستی انجام شود وجود دارد.زمانی که مجموعههای دادهای بزرگ قابلیت ارایه نتایج بهتر داده کاوی را دارند، هیچ تضمینی در مورد ارایه دانش بهترتوسط اینها نسبت به مجموعه های کوچک وجود ندارد. حال در مورد داده های چند بعدی دادهشده، سیوال اصلی این است که آیا میتوان قبل از جست وجوی تمامی راه حل های مساله داده کاوی در تمامی ابعاد، قابلیت روش مذکور را برای کاوش و کشف در یک مجموعه تلخیص شده از داده ها تعیین کرد. یک راه حل بسیار متداول از یک زیر مجموعه ای از حالات یا ویژگی های قابل دسترس استنتاج شده، در صورت بزرگ شدن فضای جست وجو، این راه حل تغییری نخواهدکرد. موضوع اصلی برای پیاده سازی داده ها در این گام, تلخیص 1 ابعاد میباشد و سیوال اصلی این است که آیا میتوان برخی از این داده های آماده و پیش پردازش شده را بدون لطمه زدن به کیفیت نتیجه حذف کرد یک سیوال دیگر نیز در رابطه با فنون تلخیص داده ها مطرح میباشد. آیا داده های آماده شده را میتوان بازنگری کرد و یک زیر مجموعه مناسب از نظر زمان و فضا پیدا کرد اگر پیچیدگی الگوریتم تلخیص داده ها به صورت نمایی افزایش یابد، آنگاه تلخیص ابعاد در داده های بزرگ بسیار اندک خواهد بود. در این مقاله، فنون پایه ای و نسبتا کارا برای تلخیص بعد که در مسایل مختلف دادهکاوی کاربرد دارند را معرفی میکنیم.کلیدواژه ها
تلخیص ابعادی, آنتروپی و تحلیل مولفه ها, فنون ادغام, رتبه بندی ویژگی , پیش پردازش فرآیندداده کاویمقالات مرتبط جدید
- بررسی به کارگیری سیستم ذخیره سازی انرژی با استفاده از منابع انرژی تجدیدپذیر
- اقدامات لازم برای حفاظت از محیط زیست دریایی
- ارائه طرح مبتنی بر رایانش ابری جهت ارتقاء بهره وری صنایع خودروسازی (مطالعه موردی: مدیران خودرو)
- مروری بر تکنولوژی ماکرویو برای خردایش سنگ های کمیاب
- کاربرد و بکارگیری تکنولوژی های اینترنت اشیا ، یادگیری ماشین و پردازش تصویر در امنیت و کنترل خودرو
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.