بهینه سازی معماری حافظه برای شتاب دهنده های هوش مصنوعی

محمد عینی

بهینه سازی معماری حافظه برای شتاب دهنده های هوش مصنوعی

محل انتشار: بیست و هفتمین کنفرانس ملی پژوهش های کاربردی در علوم برق، کامپیوتر و مهندسی پزشکی

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 147

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2639593

شناسه ملی سند علمی:

ECMECONF27_110

تاریخ نمایه سازی: 30 خرداد 1405

چکیده مقاله:

رشد سریع کاربردهای هوش مصنوعی و گسترش مدل های یادگیری عمیق، نیاز به شتاب دهنده های سخت افزاری کارآمد، کم مصرف و مقیاس پذیر را به یکی از مسائل اصلی طراحی سامانه های پردازشی تبدیل کرده است. با وجود افزایش توان محاسباتی در معماری های نوین، بخش قابل توجهی از زمان اجرا و مصرف انرژی در این سامانه ها همچنان به جابه جایی داده میان حافظه و واحدهای پردازشی اختصاص دارد. این مسئله نشان می دهد که افزایش تعداد واحدهای محاسباتی به تنهایی برای بهبود عملکرد کافی نیست و معماری حافظه باید به عنوان یکی از اجزای بنیادین شتاب دهنده های هوش مصنوعی بازطراحی شود. هدف این پژوهش، ارائه و ارزیابی یک معماری حافظه چندسطحی برای شتاب دهنده های هوش مصنوعی است که با توجه به نوع داده، میزان تکرار استفاده، فاصله زمانی دسترسی و الگوی رفتاری مدل، داده های پرتکرار را در سطوح نزدیک تر به واحد پردازشی نگهداری می کند. در این معماری، علاوه بر ساختار چندسطحی حافظه، از سازوکار پیش بینی دسترسی داده و سیاست جایگزینی هوشمند استفاده شد تا داده های مورد نیاز پیش از زمان مصرف به حافظه نزدیک منتقل شوند و فضای محدود حافظه محلی برای داده های با احتمال استفاده مجدد بالاتر اختصاص یابد. پژوهش از نظر هدف کاربردی و توسعه ای و از نظر روش، تحلیلی و شبیه سازی محور است. سناریوهای آزمایشی شامل معماری پایه، حافظه چندسطحی، پیش بینی دسترسی، سیاست جایگزینی هوشمند و معماری کامل پیشنهادی بودند. شاخص های ارزیابی شامل مصرف انرژی انتقال داده، تاخیر دسترسی، تعداد دسترسی به حافظه بیرونی، نرخ بازاستفاده داده، نرخ استفاده از واحدهای پردازشی و زمان کل اجرای مدل بود. نتایج نشان داد که معماری پیشنهادی مصرف انرژی انتقال داده را حدود ۳۹ درصد، تاخیر دسترسی را حدود ۳۶ درصد و تعداد دسترسی به حافظه بیرونی را بیش از ۵۰ درصد کاهش داده است. همچنین نرخ بازاستفاده داده حدود ۲۹ واحد درصد و نرخ استفاده از واحدهای پردازشی حدود ۱۹ واحد درصد افزایش یافت. زمان کل اجرای مدل نیز به طور میانگین حدود ۲۶ درصد کاهش پیدا کرد. بر اساس نتایج، بهینه سازی معماری حافظه می تواند یکی از موثرترین راهکارها برای کاهش گلوگاه انتقال داده، افزایش بهره وری انرژی و بهبود کارایی شتاب دهنده های هوش مصنوعی باشد.

کلیدواژه ها:

معماری حافظه ، شتاب دهنده های هوش مصنوعی ، حافظه چندسطحی ، پیش بینی دسترسی داده ، بهره وری انرژی ، بازاستفاده داده.

نویسندگان

محمد عینی

۱- کارشناسی ارشد کامپیوتر گرایش نرم افزار، دانشگاه خاتم، کارشناس امنیت، تهران، ایران.