تحلیل پتانسیل برداری شدن خودکار بسته محک پارسک

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 612

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCONF02_289

تاریخ نمایه سازی: 19 اردیبهشت 1395

چکیده مقاله:

با توجه به اهمیت و توسعه پردازش برداری در برنامه های محاسباتی مختلف، بهره گیری از قابلیت برداری کردن کامپایلرها در بسیاری از پژوهش ها مورد توجه قرار گرفته است. هدف این مقاله، بررسی پتانسیل برداری شدن خودکار بسته محک پارسک به عنوان نماینده برنامه های کاربردی مختلف با حجم محاسبات بالا توسط کامپایلرهای GCC و ICC می باشد. از این رو، با استفاده از ابزارهای تحلیل کارآیی بخش های زمانبر هر برنامه را تعیین کردیم. سپس موانع برداری شدن توسط کامپایلر را بررسی و راه حل هایی برای رفع آنها ارائه نمودیم. سپس این راه حل ها را که در راستای تغییر ساختار حلقه ها و ساختمان داده ها بدون تغییر الگوریتم هر برنامه می باشند، بر روی برنامه های بسته محک پارسک اعمال کردیم و دوباره برنامه ها را از لحاظ تعداد حلقه های برداری شده تحلیل کردیم. نتایج نشان داد که اعمال این تغییرات تأثیر قابل توجهی بر برداری شدن بخش های زمانبر برنامه و در نتیجه افزایش کارآیی و بهره وری سیستم داشته است.

کلیدواژه ها:

بسته محک پارسک ، برداری کردن خودکار ، تحلیل کارآیی ، بهینه سازی در سطح کامپایل

نویسندگان

فهیمه یزدان پناه

استادیار بخش مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهید باهنر کرمان

ساره کاربخش

دانشجوی کارشناسی ارشد، مهندسی کامپیوتر (نرم افزار)، موسسه آموزش عالی غیرانتفاعی بعثت

سلیمه ضیاءالدینی

دانشجوی کارشناسی ارشد، مهندسی کامپیوتر (نرم افزار)، موسسه آموزش عالی غیرانتفاعی بعثت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • C. Bienia, S. Kumar, J. P. Singh, & K. Li. ...
  • GCC-GNU: https ://gcc .gnu.org/proj ects/tree _ S S a/vec torization ...
  • H. Chang and W. Sung (2008). "Efficient Vectorization of SIMD ...
  • Susan L. Graham Peter B. Kessler Marshall K. McKusick. (1982)."gprof: ...
  • Pintool: https ://software. intel. com/en _ _ s/articles/p intool/. ...
  • G. Ren, P. Wu, D. Padua. (2005). _ Empirical Study ...
  • J. Shin, (2007). "Introducing Control Flow intro Vectorized Code", IEEE, ...
  • J. E. Smith, G. Faanes, R. Suqummar, (2000). _ Instruction ...
  • M. Gschwind, (2006) "Chip _ Itiprocessing and the Cell broadband ...
  • NVIDIA _ (Computer Unified Device Architecture), (2007). http ://www .nvidia.com/. ...
  • CARY-2 Engineering Maintenance Manual, (1985). Cray Research Inc., Publication No. ...
  • J. M. Cebrian, L. Natvig, and J. C. Meyer, (2012) ...
  • Saeed Maleki, Yaoqing Gao, Maria J. Garzaran, Tommy Wong and ...
  • L. Seiler, D. Carmean, E. Sprangle, T. Forsyth, M. Abrash, ...
  • نمایش کامل مراجع