Improving Clustering Algorithm Based On K In Big Data

  • سال انتشار: 1394
  • محل انتشار: چهارمین کنفرانس بین المللی پژوهش های نوین در علوم مهندسی و تکنولوژی
  • کد COI اختصاصی: NSOECE04_191
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 672
دانلود فایل این مقاله

نویسندگان

Shirin Abbasi1

Department of Computer Engineering , Master student of Software Engineering, University of Islamic Azad University, Central Branch of Tehran, Iran,

Babak Vaziri2

Department of Computer Engineering, Faculty of Software Engineering, University of Islamic Azad University, Central Branch of Tehran, Iran

چکیده

Big data processing and management is taken into consideration in recent years, frameworks and special tools have been introduced for this purpose and data analyzing is studied as massive data management. Different operations carried out on data management that group of such operation are as preprocessing which is performed on data to prepare data for basic operations. In this study, we check out main clustering algorithms in big data and due to studies on this algorithm, some ways suggested that consider main parameters which improve the big data clustering. At last, we evaluated the suggested method on Persian dataset and also described to make ready this dataset.

کلیدواژه ها

Clustering, Big data, big data management, K-Means-Bisecting, K-Means

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.