مروری بر روش های خوشه بندی موازی داده های حجیم

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 949

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEEE07_209

تاریخ نمایه سازی: 19 اردیبهشت 1395

چکیده مقاله:

خوشه بندی یک تکنیک مناسب داده کاوی است که نقاط را طوری گروه بندی می کند که نقاطی با یک گروه خواص مشابه ی داشته باشند و نقاط مربوط به گروه های مختلف با یکدیگر متفاوت اند. این تکنیک به عنوان یک ابزار قدرتمند به منظور پردازش داده های تولیدشده توسط برنامه های مختلف گردیده است. مقیاس پذیری برای الگوریتم های خوشه بندی هر روز مهم و مهمتر می شود. افزایش پیچیدگی داده عمدتا منجر به پیدایش دو جنبه خواهد شد: حجم عظیم داده ها و ابعاد بالا. با پیشرفت های بیشتر پایگاه داده ها و تکنولوژی های اینترنت الگوریتم های خوشه بندی با چالش هایی درزمینه مدیریت رشد سریع داده مواجه هستند و علیرغم پیشرفت های قابل توجه در تکنولوژی پردازنده ها در زمینه سرعت، الگوریتم های خوشه بندی سریالی وظایف موردنیاز را در یک مدت زمان منطقی برای مجموعه داده های عظیم به طور کامل انجام نمی دهند. آنها در عمل نیازمند چندین پویش داده برای رسیدن به همگرایی می باشند که برای پایگاه داده های بزرگ این پویش بسیار گران تمام می شود. به علاوه، ممکن است مقدار حافظه موجود به قدری کافی نباشد که تمام داده را در یک کامپیوتر نگهداری کند. لذا اهمیت خوشه بندی موازی برای داده های حجیم بسیار پررنگ می شود. در این مقاله سعی در بررسی روش های موجود جهت خوشه بندی موازی داده های حجیم را داریم.

نویسندگان

جلیل طوسی فر

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی مشهد، ایران

مهرداد جلالی

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی مشهد، ایران

مجید وفایی جهان

گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی مشهد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Sagiroglu, S. and D. Sinanc. Big data: A review. in ...
  • _ _ Big Data The IBM Big Data ...
  • _ _ _ Algorithms for Big Data: ...
  • Yldurm, A.A. and C. Ozdogan, Parallel WaveCluster: A linear scaling ...
  • _ _ _ , #" Scaling Clustering ...
  • Olson, C.F., Parallel algorithms for hierarchicl clustering. Parallel computing, 1995. ...
  • _ _ _ _ Springer. p. 263-290. ...
  • _ _ _ _ _ _ _ _ for hierarchical ...
  • Olman, V., et al., Parallel clustering algorithm for large data ...
  • _ _ _ _ Transactions on, 2003. 15(3): p. 629-641. ...
  • _ _ _ _ single-link ...
  • _ clustering algoriths Parallel Computin, ...
  • نمایش کامل مراجع