ارزیابی عملکرد کرنل opencl در CPU های چند هسته ای
محل انتشار: سومین کنگره بین المللی کامپیوتر، برق و مخابرات
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 652
فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC03_101
تاریخ نمایه سازی: 6 اردیبهشت 1396
چکیده مقاله:
با توجه به هدف طراحی قابلیت حمل پذیری OpenCL، از این پلت فرم علاوه بر استفاده در محیط های GPU، در پردازندههای چندهستهای نیز قابل بهرهبرداری میباشد. یکی از مسایل مربوطه به این پلت فرم در محیط های CPU قابلیت حمل پذیری عملکرد OpenCL است. در این مقاله تاثیر دانهبندی در بهبود عملکرد کرنل OpenCL مورد بررسی قرار می گیرد. با انجام آزمایش هایی برای چند برنامه از بنچمارک Rodinia در پردازندهی چندهستهای با مجموعه داده های مختلف بهترین دانه بندی برای هر یک از برنامه ها به صورت تجربی انتخاب میشود. با توجه به این آزمایشها و کمک گرفتن از دادههای عملکرد پردازنده Hardware performance counters) از جمله میزان cache-miss، عوامل موثر در بهترین دانه بندی شناسایی می شوند تا بتوان مقدار بهینه ی این متغیر را با توجه به الگوی دسترسی و جریان یک کرنل OpenCL، بهترین دانهبندی را برای آن حدس زد. در این مقاله، علت تاثیرگذاری تغییرات عملکرد با تغییر اندازه work-group برررسی شده و برنامه ها در آن اندازه work-group بهینه با توجه به خروجی ابزار perf قابل توجیه است.
کلیدواژه ها:
نویسندگان
عطیه جواهری
کارشناسی ارشد کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل
مجتبی منصوری
استادیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل
علی غلامی رودی
استادیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :