Data Placement Based On Hierarchical Clustering on Scientific Workflows

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 999

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISCEE18_116

تاریخ نمایه سازی: 12 تیر 1395

چکیده مقاله:

Data play the main role in scientific workflows. In the cloud environment there are many workflows need these data and their size might be exceeded to terabytes or petabytes. Since these workflows consist of many interdependent tasks and each task in the workflow requires some dataset as its input, the data should be somehow managed in order to produce decent results in both task execution and data movements. The required datasets might be placed on different locations, hence, the required datasets for a task needs to be retrieved and positioned in the destination host. It causes data movements and makes some delay on the task execution. In these paper we study a kind of clustering, called hierarchical, and used it as an approach for better data placement. The performance of this method is compared with random data placement and an extended genetic algorithm. The results show about 20% improvement is obtained against random data placement.

کلیدواژه ها:

Keywords—Hierarchical Clustering ، Data Placement ، Scientific Workflows ، Data Management on Cloud Environment

نویسندگان

Amirmohammad Pasdar

Computer department of Khayyam University

Toktam Ghafarian

Computer department of Khayyam University

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A. Weiss, "Computing in the cloud, " ACM Networker, vol. ...
  • M. Brantner, D. Florescuy, D. Graf, D. Kossmann and T. ...
  • _ _ _ Com munication, 2008. ...
  • R. Grossman, "Data mining using high performance data clouds: experimental ...
  • _ _ _ International Parallel & Distributed, pp. I-11, 2008. ...
  • R. N. Calheiros, R. Ranjan, A. Beloglazov, C. A. F. ...
  • _ Buyya, "CloudSim: a toolkit for modeling and simulation of ...
  • X. Liu and A. Datta, "Towards intelligent data placement for ...
  • D. Yuan, Y. Yang, X. Lio and J. Chen, "A ...
  • _ _ _ _ _ International Conference on Computer Science ...
  • _ _ _ _ _ Workflows, " International Conference on ...
  • نمایش کامل مراجع