مهاجرت پویای فرایند برای مقابله با خرابی در سیستم های محاسباتی توزیع شده

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,742

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE16_024

تاریخ نمایه سازی: 6 اسفند 1386

چکیده مقاله:

معمولاً اجرای برنامه های موازی MPI در محیط های محاسباتی در معرض خرابی سیستم و یا شبکه می باشد. مقابله با خرابی در این محیط ها امری اجتناب ناپذیر است. تکتیک های مختلفی مانند check pointing و مهاجرت فرایند در این زمینه وجود دارد. ما در این مقاله یک روش پویا برای مهاجرت فرایند ارایه کرده ایم. در روش پیشنهادی ما، میانگین بار کاری تمامی گره ها در بازه زمانی مشخص بررسی شده و در هنگام وقوع خرابی فرایند خراب شده به گره ای مهاجرت داده می شود که دارای کمترین میانگین بار کاری بوده و پردازنده آن بیکار تر است. برای جلوگیری از تکرار پردازش های انجام شده، فرایند خراب شده در گره جدید می تواند کار خود را از آخرین نقطه ای که checkpoint گرفته شده است ادامه دهد. در انتها ما روش پویا را با روش ایستا مقایسه کرده ایم. نتایج آزمایشات نشان می دهد که روش پویا، زمان اجرای برنامه های سنجش NPB برای اندازه داده های کلاسهای A و B را بطور میانگین 25 و 59 درصد کاهش می دهد.

نویسندگان

محمد رضا مجمع

دانشگاه آزاد اسلامی واحد قزوین

حسین پدرام

دانشگاه صنعتی امیرکبیر

مهدی امینیان

دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • T.E. Anderson et al, "A case for NOW, " IEEE ...
  • G. Stellner, "CoCheck: Checkpointing and Process Migration for MPI, " ...
  • A. M. Agbaria, and R. Friedman, "Starfish: Fault- Tolerant Dynamic ...
  • S. Sankaran, J. M. Squyres, B. Barrett, and A. Lumsdaine, ...
  • A. Bouteiller, F. Cappello, et al, "MPICH-V2: a fault tolerant ...
  • Travis Frisinger, "A Modification of OpenMosix's Process Migration Algorithm to ...
  • http : //www. cs _ wi sc _ e du/co ...
  • Cong Du and Xian-He Sun, "Design and Imp lementation of ...
  • Randell, "System structure for software fault tolerance, " IEEE Trans. ...
  • E. N. (Mootaz) Elnozahy, Lorenzo Alvisi, Yi- Min Wang, David ...
  • Y. M. Wang, Y. Huang, K.P. Vo, P. Y.Chung, and ...
  • E. Strom and S. Yemini, "Optimistic recovery in distributed systems, ...
  • Dejan S., Fred Douglis, Yves Paindaveine, Richard Wheeler and Songnian ...
  • Ramon Lawrence, "A Survey of Process Migration Mechanisms, " University ...
  • William Gropp, Ewing Lusk, Nathan Doss, and Anthony Skjellum, _ ...
  • D. H. Bailey, T. Harris, et al, "The NAS parallel ...
  • نمایش کامل مراجع