Migration Aware Scheduling in GPU as a Service Systems

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 108

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP07_019

تاریخ نمایه سازی: 7 خرداد 1401

چکیده مقاله:

Systems with GPU instead of CPU can be used for parallel jobs such as deep learning jobs training. In cloud computing data centers, there are servers with GPU instead of CPU. Since the time unit price of GPU servers is ۵ or ۸ x higher than CPU servers. Optimal using of GPU servers is a challenging problem. This paper proposes a migration aware scheduling model for GPU servers that are running parallel jobs with the aim to increase acceptance rate and reduce latency. The evaluation results show that the proposed method works better in migrating jobs than other basic models such as FIFO and without migration models

کلیدواژه ها:

GPU as a service ، scheduling ، parallel job ، migration.

نویسندگان

Arezoo Jahani

faculty of electrical engineering, Sahand University of Technlogy, Tabriz, Iran