طراحی و پیاده سازی چارچوب یادگیری تقویتی عمیق مبتنی بر PPO برای تخصیص پویای منابع در سیستم های محاسباتی توزیع شده

فایل این در 7 صفحه با فرمت PDF قابل دریافت می باشد

  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این :

چکیده :

با گسترش روزافزون زیرساخت های محاسباتی نظیر رایانش ابری، لبه ای و سیستم های توزیع شده، مدیریت بهینه منابع به یکی از چالش های حیاتی در مهندسی کامپیوتر تبدیل شده است. روش های سنتی تخصیص منابع، به دلیل ماهیت ایستا و عدم توانایی در انطباق با تغییرات دینامیکی سیستم، کارایی مطلوبی در محیط های واقعی ندارند. در این پژوهش، یک چارچوب نوین مبتنی بر یادگیری تقویتی عمیق و الگوریتم بهینه سازی سیاست PPO ارائه شده است که قادر است در محیط های پویا و غیرقطعی، سیاست تخصیص منابع را به صورت تطبیقی یاد بگیرد. مسئله به صورت فرایند تصمیم گیری مارکوف مدل سازی شده و عامل یادگیرنده با استفاده از داده های محیط، تصمیمات بهینه اتخاذ می کند. نتایج شبیه سازی نشان می دهد که روش پیشنهادی نسبت به الگوریتم های FCFS و Round Robin، موجب کاهش قابل توجه تاخیر، افزایش بهره وری منابع و بهبود پایداری سیستم می شود. این چارچوب قابلیت توسعه برای کاربردهای واقعی در مراکز داده و شبکه های ابری را داراست.

کلیدواژه ها:

یادگیری تقویتی عمیق ، تخصیص منابع ، سیستم های توزیع شده

نویسندگان

سید محمد فاطمی

کارشناس ارشد امنیت شبکه

مراجع و منابع این :

لیست زیر مراجع و منابع استفاده شده در این را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود لینک شده اند :
  • Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, ...
  • Proximal Policy Optimization Algorithms. ...
  • Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). ...
  • Online learning for offloading and autoscaling in energy harvesting mobile ...
  • IEEE Transactions on Cognitive Communications and Networking, 3(3), 361–373. ...
  • نمایش کامل مراجع