A Novel Density based Clustering Method using Nearest and Farthest Neighbor with PCA

  • سال انتشار: 1396
  • محل انتشار: مجله بین المللی ارتباطات و فناوری اطلاعات، دوره: 9، شماره: 2
  • کد COI اختصاصی: JR_ITRC-9-2_004
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 243
دانلود فایل این مقاله

نویسندگان

Azadeh Faroughi

Reza Javidan

چکیده

Common nearest-neighbor density estimators usually do not work well for high dimensional datasets. Moreover, they have high time complexity of O(n2) and require high memory usage especially when indexing is used. In order to overcome these limitations, we proposed a new method that calculates distances to nearest and farthest neighbor nodes to create dataset subgroups. Therefore computational time complexity becomes of O(nlogn) and space complexity becomes constant. After subgroup formation, assembling technique is used to derive correct clusters. In order to overcome high dimensional datasets problem, Principal Component Analysis (PCA) in the clustering method is used, which preprocesses high-dimensional data. Many experiments on synthetic data sets are carried out to demonstrate the feasibility of the proposed method. Furthermore we compared this algorithm to the similar algorithm –DBSCAN- on real-world datasets and the results showed significantly higher accuracy of the proposed method.

کلیدواژه ها

nearest_neighbor density estimator, farthest neighbor, subgroups, principal component analysis(PCA)

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.