شبکه عصبی ژنتیک برای دستیابی به تعادل بازخورد nash در بازی های پویا
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 474
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF02_165
تاریخ نمایه سازی: 5 بهمن 1395
چکیده مقاله:
این مقاله روش عددی همه منظوره برای محاسبه تعادل بازخورد nash در بازی پویا ایجاد می کند. استراتژی های بازخورد بازیکنان در ابتدا توسط شبکه عصبی تقریب زده می شود و سپس بوسیله الگوریتم های ژنتیکی موازی برای جستجو در سرتاسر استراتژی های تعادل ثابت زمان به طور همزمان و به صورت آنلاین آموزش داده می شود. به منظور حذف وابستگی آموزشی به شرایط اولیه بازی، بازیکنان از سیاست های بازخورد ساکن یکسانی (شبکه های مشابه)، به منظور بازی کردن پیوسته از تعدادی وضعیت های اولیه در هر تولید استفاده می کنند. و سپس تناسب استراتژی بازخورد ارائه شده به عنوان مجموع بازدهی همه وضعیت های اولیه محاسبه می شود. تعادل تکاملی بازی بین الگوریتم های ژنتیکی تعادل بازخورد nashدر بازی پویاست. به یک مدل انحصار چند جانبه با سرمایه گذاری به عنوان یک نموته عددی دسترسی حاصل می شود.
کلیدواژه ها:
نویسندگان
فاطمه استوار
گروه کامپیوتر ، گرایش هوش مصنوعی ، دانشکده علوم و تحقیقات بوشهر
سیده مریم ابراهیمی عسکری
گروه کامپیوتر ، گرایش هوش مصنوعی ، دانشکده علوم و تحقیقات بوشهر