مروری سیستماتیک بر توسعه یادگیری تقویتی با استفاده از نظریه بازی و کاربردهای آن در مهندسی صنایع

سمانه مبینی دهکردی; صبا صارمی نیا

مروری سیستماتیک بر توسعه یادگیری تقویتی با استفاده از نظریه بازی و کاربردهای آن در مهندسی صنایع

محل انتشار: چهارمین کنفرانس بین المللی چالش ها و راهکارهای نوین در مهندسی صنایع، مدیریت و حسابداری

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 18

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2625444

شناسه ملی سند علمی:

CSIEM04_803

تاریخ نمایه سازی: 17 خرداد 1405

چکیده مقاله:

یادگیری تقویتی (Reinforcement Learning (RL)) طی سالهای اخیر از چارچوب های کلاسیک مبتنی بر برنامه ریزی پویا و الگوریتم های تفاوت زمانی به رویکردهای عمیق و ترکیبی تحول یافته و به یکی از ابزارهای محوری در حل مسائل پیچیده نظیر کنترل رباتیک، بهینه سازی شبکه ها و تصمیم گیری در سیستم های چندعاملی تبدیل شده است. با وجود این پیشرفت ها چالش هایی همچون نیاز به حجم گسترده ای از داده های آموزشی، ناپایداری و عدم همگرایی برخی الگوریتم ها و محدودیت در تعمیم پذیری به کاربردهای صنعتی همچنان باقی است. یکی از راهکارهای نوین برای غلبه بر این محدودیت ها ادغام RL با نظریه بازی ها است که بستر تحلیلی لازم را برای مدل سازی و تحلیل تعاملات رقابتی و همکارانه میان عامل ها فراهم می سازد. این مقاله مروری با رویکردی نظام مند پژوهش های منتشر شده در بازه زمانی ۲۰۱۵ تا ۲۰۲۵ را مورد بررسی قرار داده و با استفاده از فرآیند غربالگری چند مرحله ای ۴۵ مطالعه مرتبط را انتخاب کرده است. نتایج این مرور نشان می دهد که ترکیب RL و نظریه بازی ها نقش بسزایی در ارتقای کارایی، پایداری و تفسیرپذیری الگوریتم های یادگیری تقویتی داشته و به ویژه در حوزه هایی چون سیستم های چندعاملی، مدیریت زنجیره تامین و سامانه های سایبرفیزیکی و انسانی منجر به بهبود چشمگیر عملکرد شده است. در پایان بر اساس یافته های این مرور مسیرهای نوینی برای تحقیقات آتی در حوزه مهندسی صنایع و سیستم های پیچیده پیشنهاد می شود.

کلیدواژه ها:

یادگیری تقویتی ، نظریه بازی ها ، سیستم های چندعاملی ، بهینه سازی ، زنجیره تامین

نویسندگان

سمانه مبینی دهکردی

دانشکده مهندسی صنایع و سیستم ها دانشگاه صنعتی اصفهان، اصفهان، ایران

صبا صارمی نیا

استادیار دانشکده مهندسی صنایع و سیستم ها دانشگاه صنعتی اصفهان، اصفهان، ایران