مطالعه بهینه سازی کارایی سخت افزار برای شبکه های عصبی با حافظه طولانی مدت و کوتاه مدت

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 111

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCT24_029

تاریخ نمایه سازی: 4 دی 1403

چکیده مقاله:

شبکه های عصبی ، که با الهام از ساختار مغز انسان ساخته شدهاند، به طور گسترده در هوش مصنوعی و یادگیری ماشینبرای وظایفی مختلف از جمله استخراج ویژگی ها، طبقه بندی داده و کنترل سیستم ها مورد استفاده قرار می گیرند. دلیلاین کاربرد گسترده، به خاطر داشتن ویژگی های غیرخطی و توانایی خود -انطباقی این شبکه ها است. این مقاله بهبررسی پیاده سازی سخت افزاری شبکه های عصبی حافظه طولانی مدت و کوتاه مدت می پردازد، که نوعی پیشرفته ازشبکه های عصبی بازگشتی هستند که به دلیل تواناییشان در پردازش داده های ترتیبی به خوبی شناخته شده اند. با اینحال، تقاضای محاسباتی بالای شبکه های LSTM باعث ایجاد چالش های بزرگی در پیاده سازی سخت افزاری به ویژه در محیطهایی با منابع محدود، مانند اینترنت اشیا شده است. در این مقاله، پیشرفت های اخیر در خصوص طراحی سخت افزار برای شبکه های LSTM مورد بررسی قرار می گیرند، با تاکید بر روشهایی که از محاسبات غیر دقیق بهره میبرند تا پیچیدگی سخت افزاری و مصرف انرژی را کاهش دهند.همچنین، این مقاله به بررسی سایر تکنیک های مختلف بهینه سازی مانند الگوریتم های فشرده سازی و هرس کردن شبکه های عصبی در جهت بهبود کارایی پردازش LSTMمی پردازد و ظرفیت این روش ها را ارزیابی می کند. علاوه بر این، مقاله به بررسی موازنه های موجود بین دقت و مصرفمنابع در زمینه استفاده این روشهای نوظهور سخت افزاری می پردازد.

کلیدواژه ها:

شبکه های عصبی ، حافظه طولانیمدت و کوتاه مدت ، محاسبات تصادفی ، محاسبات تقریبی

نویسندگان

امیرارسلان ساختیانچی

گروه مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)، پردیس گرمسار،ایران

کوروش منوچهری کلانتری

گروه مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)، پردیس گرمسار،ایران

مهرشاد خسرویانی

گروه مهندسی کامپیوتر و فناو ری اطلاعات، واحد پرند، دانشگاه آزاد اسلامی، پرند، تهران