Accelerating high-order WENO schemes using two heterogeneous GPUs

  • سال انتشار: 1396
  • محل انتشار: مجله مکانیک کاربردی محاسباتی، دوره: 48، شماره: 2
  • کد COI اختصاصی: JR_JCAM-48-2_002
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 375
دانلود فایل این مقاله

نویسندگان

Hossein Mahmoodi Darian

Faculty of Engineering Science, College of Engineering, University of Tehran, Tehran, Iran

چکیده

A double-GPU code is developed to accelerate WENO schemes. The test problem is a compressible viscous flow. The convective terms are discretized using third- to ninth-order WENO schemes and the viscous terms are discretized by the standard fourth-order central scheme. The code written in CUDA programming language is developed by modifying a single-GPU code. The OpenMP library is used for parallel execution of the code on both the GPUs. Data transfer between GPUs which is the main issue in developing the code, is carried out by defining halo points for numerical grids and by using a CUDA built-in function. The code is executed on a PC equipped with two heterogeneous GPUs. The computational times of different schemes are obtained and the speedups with respect to the single-GPU code are reported for different number of grid points. Furthermore, the developed code is analyzed by CUDA profiling tools. The analyze helps to further increase the code performance.

کلیدواژه ها

Multi-GPU, CUDA, OpenMP, WENO schemes, Compressible viscous flow

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.