ترکیب عملیات checkpoint هماهنگ و غیر هماهنگ در قرارداد ثبت بدبینانه وقایع مبتنی بر فرستنده

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,377

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI12_196

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

اجرای برنام ه های موازی MPI بر روی سیستمهای کلاستر و گری د معمولاً در معرض خطر خرابی سیستم و یا شبکه م یباش د. لذا استفاده از پیاد هسازیهای تحمل پذیر در برابر خرابی در این گونه سیستمها امری اجتناب ناپذیر اس ت. دو دسته از روشها برای تحم لپذیر ساختن این گونه سیستمها به کار می رود که یکی مبتنی برcheckpoint گرفتن از حالت پروسه های در حال اجرا و دیگری مبتنی بر ثبت وقایع می باشد.عیب روش ثبت بدبینان ه وقای ع مبتنی بر فرستنده که در دسته دوم قرار م یگیرد حجم زیاد پیامهایی است که باید در حافظه فرار نگ هداری شوند. در این مقاله ما برای رفع مشکل ذکر شده روشcheckpoint هماهنگ از محتوی پیامها (CCMP)را ارائه کرد هایم. نتایج آزمایشات دلالت بر کاهش زمان اجر ا در روش پیشنهاد ی برای برنام ه های سنجش NPB در محیطهای بدون خرابی و دارای خرابی دارد.

کلیدواژه ها:

کلاستر ، بازیافت ، تحمل خرابی ، قرارداد ثبت بدبینانه وقایع

نویسندگان

مهدی امینیان

دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع

محمدکاظم اکبری

استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ام

بهمن جوادی

دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • دانشگاه شهید بهشتی، دانشکده مهندسی برق و کامپیوتر، تهران، ایران، ...
  • W. Gropp and E. Lusk, ?Fault tolerance in MPI programs, ...
  • D. B. Johnson and W. Zwaenepoel, *Sender-based message logging, 17" ...
  • D. H. Bailey, T. Harris, et al, 0The NAS parallel ...
  • E. Strom and S. Yemini, 'Optimistic recovery in distributed systems, ...
  • E. N. Elnozahy and W. Zwaenepoel, _ On the use ...
  • D.B. Johnson, *Distributed System Fault Tolerance Using Message Logging and ...
  • A. Bouteiller, T. Herault, et al, ?MPICH-V: a Multiprotocol Fault ...
  • A. P. Sistla and J. L. Welch, *Efficient distributed recovery ...
  • M. Elnozahy, L. Alvisi, Y. M. Wang and D. B. ...
  • A. Bouteiller, F. Cappello, et al, ?MPICH-V2: a fault tolerant ...
  • Message Payload Checkpoint ...
  • Checkpoint Server ! open-Source ...
  • Fast Ethernet " Dispatcher ...
  • Checkpoint Scheduler * Event Logger ...
  • نمایش کامل مراجع