یک عامل نقاد پیشرفته برای یادگیری عامل در محیط بازی فوتبال گوگل

  • سال انتشار: 1400
  • محل انتشار: هفتمین کنفرانس بین المللی بازی های رایانه ای، فرصت ها و چالش ها
  • کد COI اختصاصی: CGCO07_067
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1012
دانلود فایل این مقاله

نویسندگان

شقایق صفاری

دانشجوی دکتری، دانشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

مرتضی دری گیو

استادیار دانشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

فرزین یغمایی

دانشیار دانشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

چکیده

این مقاله یک معماری یادگیری تقویتی عمیق را که عامل نقاد ۱ پیشرفته نامیده میشود و بر اساس معماری عامل نقاد است، برای یادگیری بهتر عامل در محیط بازی فوتبال ارائه میدهد. از آ نجاییکه گاهی در برخی حالات، برخی اقدامات لزومی ندارند که اعمال شوند، بنابرای ن این مدل به منظور دستیابی به تخمین ارزش دقیق و انتخاب صحیح عمل در فضایی پیوسته معرفی شده است. لذا وجود معیاری برای ارزیابی میزان اهمیت و مزیت هر عمل در هر حالت، میتواند پارامتر ارزشمند ی باشد. از این رو با توجه به مزایای معماری DQN duelingو عامل نقاد، معماری ارائه شده از ترکیب شبکهDueling DQN در معمار ی عامل نقاد استفاده کرده است. هدف، بهبود عملکرد معماری عامل نقاد معمولی در یک محیط پیچیده است. مطالعه موردی از اموزش عامل، یادگیری در محیط بازی فوتبال است. نتایج تایید میکند که معماری بهبود یافته، به طور موثر عملکرد را از نظر میانگین پاداش، نسبت به هر یک از دو معماری Dueling DQN و عامل نقاد به صورت جداگانه بهبود میدهد. از این رو تجزیه و تحلیل در مورد معماری ارائه شده و نتایج ارائه شده است

کلیدواژه ها

یادگیری تقویتی عمیق، بازی فوتبال، عامل نقاد، Dueling DQN ، عامل نقاد پیشرفته

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.