K-means Clustering Algorithms on MapReduce: A Review
- سال انتشار: 1393
- محل انتشار: سومین کنفرانس الکترونیکی بین المللی فن آوری اطلاعات،حال و آینده
- کد COI اختصاصی: ITPF03_033
- زبان مقاله: انگلیسی
- تعداد مشاهده: 1203
نویسندگان
Department of Engineering Islamic Azad University of Mashhad Mashhad, Iran
Associated professor Islamic Azad University of Mashhad Mashhad, Iran
چکیده
As web clicks, commercial, social networks, andscientific data sources growing with an extraordinary rate, it isvery necessary to analyze this data with powerful clusteringalgorithms. Current data mining Algorithms cannot deal withlarge datasets due to their large size and complexity. Forextracting useful information from these large datasets, newmining techniques are necessary. K-means is the most widely usedpartitional clustering algorithm and it is extremely sensitive to theinitial centroid selection. There is a growing development ofanalysis on large datasets using MapReduce jobs. MapReduceparallel processing is a framework for working with cloudcomputing, K-means is not suitable to be used in MapReducebecause of having repetitive calculation in working with largedata. For this reason, in recent years several research to optimizethe algorithm and reduce dependence on iterative computing isdone. In this article have been trying to work in the field toinvestigate the problem. The most important improvements havetaken place on the algorithm in order to reduce the number ofiterations and improvements done in the central parts of the initialselection.کلیدواژه ها
مقالات مرتبط جدید
- طبقه بندی صفحات وب برای بهینه سازی موتورهای جستجو با استفاده از مدل ترکیبی یادگیری عمیق
- تحول دیجیتال با قراردادهای هوشمند بر پایه فناوری بلاکچین
- تحلیل و شناسایی آسیبپذیریهای ناش ی از حملات شرایط رقابتی در برنامه های وب مدرن
- مروری بر الگوریتم بهینه سازی ازدحام ذرات و کاربردها
- بهینه سازی زمانبندی و ذخیره سازی نتایج وظایف در محیطهای مه-ابر با یادگیری تقویتی
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.