مروری سیستماتیک بر توسعه یادگیری تقویتی با استفاده از نظریه بازی و کاربردهای آن در مهندسی صنایع

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 18

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSIEM04_803

تاریخ نمایه سازی: 17 خرداد 1405

چکیده مقاله:

یادگیری تقویتی (Reinforcement Learning (RL)) طی سالهای اخیر از چارچوب های کلاسیک مبتنی بر برنامه ریزی پویا و الگوریتم های تفاوت زمانی به رویکردهای عمیق و ترکیبی تحول یافته و به یکی از ابزارهای محوری در حل مسائل پیچیده نظیر کنترل رباتیک، بهینه سازی شبکه ها و تصمیم گیری در سیستم های چندعاملی تبدیل شده است. با وجود این پیشرفت ها چالش هایی همچون نیاز به حجم گسترده ای از داده های آموزشی، ناپایداری و عدم همگرایی برخی الگوریتم ها و محدودیت در تعمیم پذیری به کاربردهای صنعتی همچنان باقی است. یکی از راهکارهای نوین برای غلبه بر این محدودیت ها ادغام RL با نظریه بازی ها است که بستر تحلیلی لازم را برای مدل سازی و تحلیل تعاملات رقابتی و همکارانه میان عامل ها فراهم می سازد. این مقاله مروری با رویکردی نظام مند پژوهش های منتشر شده در بازه زمانی ۲۰۱۵ تا ۲۰۲۵ را مورد بررسی قرار داده و با استفاده از فرآیند غربالگری چند مرحله ای ۴۵ مطالعه مرتبط را انتخاب کرده است. نتایج این مرور نشان می دهد که ترکیب RL و نظریه بازی ها نقش بسزایی در ارتقای کارایی، پایداری و تفسیرپذیری الگوریتم های یادگیری تقویتی داشته و به ویژه در حوزه هایی چون سیستم های چندعاملی، مدیریت زنجیره تامین و سامانه های سایبرفیزیکی و انسانی منجر به بهبود چشمگیر عملکرد شده است. در پایان بر اساس یافته های این مرور مسیرهای نوینی برای تحقیقات آتی در حوزه مهندسی صنایع و سیستم های پیچیده پیشنهاد می شود.

نویسندگان

سمانه مبینی دهکردی

دانشکده مهندسی صنایع و سیستم ها دانشگاه صنعتی اصفهان، اصفهان، ایران

صبا صارمی نیا

استادیار دانشکده مهندسی صنایع و سیستم ها دانشگاه صنعتی اصفهان، اصفهان، ایران