مروری بر روشهای خوشهبندی موازی دادههای حجیم مبتنی برMapReduce

جلیل گزلان طوسی; مهرداد جلالی; سعید ابریشمی

مروری بر روشهای خوشهبندی موازی دادههای حجیم مبتنی برMapReduce

محل انتشار: اولین کنفرانس بین المللی مهندسی دانش،اطلاعات و نرم افزار

سال انتشار: 1393

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,790

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/344819

شناسه ملی سند علمی:

ICKIS01_019

تاریخ نمایه سازی: 25 فروردین 1394

چکیده مقاله:

خوشه بندی یک ابزار قدرتمند به منظور پردازش داده های تولیدشده توسط برنامه های مختلف می باشد. با پیشرفت پایگاه داده ها و فناوری های اینترنت الگوریتم های خوشه بندی با چالش هایی در زمینه مدیریت رشد سریع و حجم زیاد داده مواجه هستند. علی رغم پیشرفت های قابل توجه در تکنولوژی پردازنده ها درزمینه سرعت، الگوریتم های خوشه بندی سریالی وظایف موردنیاز را در یک مدت زمان منطقی برای مجموعه داده های عظیم به طور کامل انجام نمی دهند. آن ها در عمل نیازمند چندین پویش داده برای رسیدن به همگرایی می باشند که برای پایگاه داده های بزرگ این پویش بسیار گران تمام می شود. لذا اهمیت خوشه بندی موازی برای داده های حجیم بسیار پررنگ می شود. در این مقاله سعی در بررسی روش های موجود جهت خوشه بندی موازی داده های حجیم مبتنی بر MapReduce را داریم. MapReduce در اصل توسط Google به عنوان یک مدل برنامه نویسی توزیع شده که از سرورهای عظیم برای پردازش موازی مجموعه داده های انبوه (چند ترابایتی) استفاده می کند، معرفی شد، این مدل می تواند به بسیاری از برنامه های محاسباتی با حجم بزرگ اعمال شود و ویژگی های جالبی مثل موازی سازی خودکار، توازن بار، کمینه سازی انتقال دیسک و شبکه و اداره قدرتمند در هنگام شکست ماشین دارد. MapReduce با شکستن یک برنامه بزرگ به بخش های کوچک تر، پردازش هر بخش به صورت موازی و سپس ترکیب نتایج برای تولید نتیجه نهایی کار می کند

کلیدواژه ها:

داده های حجیم ، خوشه بندی ، خوشه بندی موازی

نویسندگان

جلیل گزلان طوسی

دانشگاه آزاد اسلامی واحد مشهد، گروه مهندسی کامپیوتر ، مشهد، ایران

مهرداد جلالی

دانشگاه آزاد اسلامی واحد مشهد، گروه مهندسی کامپیوتر ، مشهد، ایران

سعید ابریشمی

دانشگاه فردوسی مشهد، گروه مهندسی کامپیوتر ، مشهد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

پنجم و ششم آذرماه ماه 1393، دانشگاه آزاد اسلامی، واحد ...
Sagiroglu, S. and D. Sinanc. Big data: A review. in ...
Zikopoulos, P., et al, Harness the Power of Big Data ...
Center, I.I., Planning Guide: Getting Started with Hadoop. Steps IT ...
Yang, J. and X. Li. MapReduce Based Method for Big ...
FAHAD, A., et al., A Survey of Clustering Algorithms for ...
Y)ldrm, A.A. and C. Ozdogan, Parallel WaveCluster: A linear scaling ...
Scaling Clustering Algorithms to Large Databases. in KDD. 1998. ...
Hill, R., et al., Guide to cloud computing: principles and ...
Zhao, W., H. Ma, and Q. He, Parallel k-means clustering ...
Kim, Y., et al., DBCURE-M. An efficient density-based clustering algorithm ...
Priyanka, P. and S.A. Nabi, An Efficient Algorithm for Clustering ...
MapReduce. 2009, Boise State University. ...
mapreduce. in Procedings of the 17th ACM SIGKDD international conference ...
Fries, S., _ Wels, and T. Seidl. Projected Clustering for ...

نمایش کامل مراجع