بهبود عملکرد حمله در تیم ربات های فوتبالیست با استفاده از یادگیری تقویتی
سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 554
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_TJEE-48-2_011
تاریخ نمایه سازی: 17 تیر 1398
چکیده مقاله:
به دلیل عدم امکان پیش بینی همه وضعیت های ممکن برای عامل ها در یک سیستم چندعامله ی پویا و گسترده، روش های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل ها می باشد. فوتبال شبیه سازی شده ربات ها یک مسئله شناخته شده برای ارزیابی الگوریتم های یادگیری ماشین روی سیستم های چندعامله است. در این مقاله الگوریتم یادگیری کیو وی (یکی از الگوریتم های معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم ربات های فوتبالیست دو بعدی بکار گرفته شده است. سیگنال تقویتی براساس اینکه بازیکنانی که در حمله دخالت دارند، توپ را جلوی دروازه می رسانند، یا اینکه توپ را از دست می دهند، تعریف شده است و به ترتیب عامل ها با توجه به وضعیت ذکرشده، جایزه و جریمه دریافت می کنند. جهت بهبود عملکرد از ایده تقسیم سیگنال تقویتی متناسب با مقدار خبرگی عامل ها در یک سیستم چندعامله استفاده شده است. در اینجا میزان خبرگی متناسب با تفاوت ارزش عمل با بالاترین ارزش با ارزش عمل با کمترین مقدار ارزش در هر حالت تعریف می شود. نتایج شبیه سازی نشان می دهد، بهره گیری از ایده تقسیم سیگنال تقویتی براساس خبرگی در آموزش باعث افزایش سرعت در آموزش و بهبود عملکرد عامل ها شده است.
کلیدواژه ها:
نویسندگان
مینا خاکسار
دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر
ولی درهمی
دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر
مهدی رضائیان
دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :