Automatic clustering of big datasets using a swarm intelligence method
- سال انتشار: 1397
- محل انتشار: اولین کنگره و نمایشگاه بین المللی علوم و تکنولوژی های نوین
- کد COI اختصاصی: ICESIT01_181
- زبان مقاله: انگلیسی
- تعداد مشاهده: 519
نویسندگان
Department of Electrical engineering, University of Birjand, Birjand, Iran
Department of Electrical engineering, University of Birjand, Birjand, Iran
Department of Electrical engineering, University of Birjand, Birjand, Iran
KDD Lab, ISTI-CNR, Pisa, Italy
چکیده
Mining and discovering knowledge from big datasets have become a new interesting field of research among data scientists. In fact, extracting hidden patterns in big datasets using traditional data mining algorithms in a reasonable period of time and with an acceptable accuracy is impossible due to high volume of data and their complexity. Generally, the term big data is referred to massive datasets with huge number of high dimensional samples which makes them very hard to be analyzed by conventional data mining techniques. So designing new and effective algorithms for analyzing big datasets is necessary. Clustering, which is the process of dividing the data points into different groups based on their similarities and dissimilarities, is one of the most important data mining and big data mining methods. K-means, which is one of the most popular clustering algorithms and has been widely used in several researches, suffers from some drawbacks such as: its tendency to converge to a local optimum point, the quality of its final results depends on the initial centroids generated randomly and its inability in finding the number of clusters. In this paper a new automatic big data clustering method, based on a swarm intelligence algorithm, is introduced which has a great ability in finding the number of clusters and escaping from local optimum point. The proposed method is tested on 13 synthetics and 2 real big mobility datasets. Final results demonstrate its power in big data clustering.کلیدواژه ها
Automatic clustering, Big data analytics, K-means, Swarm intelligenceمقالات مرتبط جدید
- بررسی به کارگیری سیستم ذخیره سازی انرژی با استفاده از منابع انرژی تجدیدپذیر
- اقدامات لازم برای حفاظت از محیط زیست دریایی
- ارائه طرح مبتنی بر رایانش ابری جهت ارتقاء بهره وری صنایع خودروسازی (مطالعه موردی: مدیران خودرو)
- مروری بر تکنولوژی ماکرویو برای خردایش سنگ های کمیاب
- کاربرد و بکارگیری تکنولوژی های اینترنت اشیا ، یادگیری ماشین و پردازش تصویر در امنیت و کنترل خودرو
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.