مروری بر روشهای خوشه بندی موازی داده های حجیم

جلیل طوسی فر; مهرداد جلالی; مجید وفایی جهان

مروری بر روشهای خوشه بندی موازی داده های حجیم

محل انتشار: دومین کنگره بین المللی فن آوری، ارتباطات و دانشICTCK۲۰۱۵

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,199

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/517584

شناسه ملی سند علمی:

ICTCK02_137

تاریخ نمایه سازی: 8 آبان 1395

چکیده مقاله:

خوشه بندی یک تکنیک مناسب داده کاوی است که نقاط را طوری گروه بندی می کند که نقاطی با یک گروه خواص مشابهی داشتهباشند و نقاط مربوط به گروه های مختلف با یکدیگر متفاوت اند. این تکنیک به عنوان یک ابزار قدرتمند به منظور پردازشداده های تولیدشده توسط برنامه های مختلف گردیده است. مقیاس پذیری برای الگوریتم های خوشه بندی هرروز مهم و مهمترمی شود. افزایش پیچیدگی داده عمدتاً منجر به پیدایش دو جنبه خواهد شد: حجم عظیم داده ها و ابعاد بالا. با پیشرفت هایبیشتر پایگاه داده ها و تکنولوژی های اینترنت الگوریتم های خوشه بندی با چالش هایی درزمینه مدیریت رشد سریع داده مواجههستند و علیرغم پیشرفت های قابل توجه در تکنولوژی پردازنده ها در زمینه سرعت، الگوریتم های خوشه بندی سریالی وظایفموردنیاز را در یک مدتزمان منطقی برای مجموعه داده های عظیم به طور کامل انجام نمی دهند. آنها در عمل نیازمند چندینپویش داده برای رسیدن به همگرایی می باشند که برای پایگاه داده های بزرگ این پویش بسیار گران تمام می شود. بهعلاوه،ممکن است مقدار حافظه موجود به قدری کافی نباشد که تمام داده را در یک کامپیوتر نگهداری کند. لذا اهمیت خوشه بندیموازی برای داده های حجیم بسیار پررنگ می شود. در این مقاله سعی در بررسی روشهای موجود جهت خوشه بندی موازیداده های حجیم راداریم.

کلیدواژه ها:

داده های حجیم ، خوشه بندی ، خوشه بندی موازی ، خوشه بندی فازی

نویسندگان

جلیل طوسی فر

گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

مهرداد جلالی

گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

مجید وفایی جهان

گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Sagiroglu, S. and D. Sinanc. Big data: A review. in ...
Conference on. 2013. IEEE. ...
Zikopoulos, P., et al., Harmess the Power of Big Data ...
Yang, J. and X. Li. Mapreduce based method for big ...
Fahad, A., et al., A Survey of Clustering Algorithms for ...
Yldurm, A.A. and C. Ozdogan, Parallel WaveC luster: A linear ...
Bradley, P.S., U.M. Fayyad, and C. Reina. Scaling Clustering Algorithms ...
hierarchical clustering. Parallel computing, 1995. 21(8): p. 1313-1325. ...
Xu, X., J. Jager, and H.-P. Kriegel, A fast parallel ...
Du, Z. and F. Lin, A novel parallelization approach for ...
Olman, V., et al., Parallel clustering algorithm for large data ...
Pizzuti, C. and D. Talia, P-AutoClass: scalable parallel clustering for ...
Bradley, P.S., U. Fayyad, and C. Reina. Clustering very large ...
Yan, W., et al., p-PIC: Parallel power iteration clustering for ...
Sibson, R., SLINK: an optimally efficient algorithm for the single-link ...
Li, X. and Z. Fang, Parallel clustering algorithms. Parallel Computing, ...

نمایش کامل مراجع