شبکه عصبی ژنتیک برای دستیابی به تعادل بازخورد nash در بازی های پویا

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 474

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF02_165

تاریخ نمایه سازی: 5 بهمن 1395

چکیده مقاله:

این مقاله روش عددی همه منظوره برای محاسبه تعادل بازخورد nash در بازی پویا ایجاد می کند. استراتژی های بازخورد بازیکنان در ابتدا توسط شبکه عصبی تقریب زده می شود و سپس بوسیله الگوریتم های ژنتیکی موازی برای جستجو در سرتاسر استراتژی های تعادل ثابت زمان به طور همزمان و به صورت آنلاین آموزش داده می شود. به منظور حذف وابستگی آموزشی به شرایط اولیه بازی، بازیکنان از سیاست های بازخورد ساکن یکسانی (شبکه های مشابه)، به منظور بازی کردن پیوسته از تعدادی وضعیت های اولیه در هر تولید استفاده می کنند. و سپس تناسب استراتژی بازخورد ارائه شده به عنوان مجموع بازدهی همه وضعیت های اولیه محاسبه می شود. تعادل تکاملی بازی بین الگوریتم های ژنتیکی تعادل بازخورد nashدر بازی پویاست. به یک مدل انحصار چند جانبه با سرمایه گذاری به عنوان یک نموته عددی دسترسی حاصل می شود.

کلیدواژه ها:

تعادل بازخورد nash ، الگوریتم های ژنتیکی موازی ، شبکه های عصبی

نویسندگان

فاطمه استوار

گروه کامپیوتر ، گرایش هوش مصنوعی ، دانشکده علوم و تحقیقات بوشهر

سیده مریم ابراهیمی عسکری

گروه کامپیوتر ، گرایش هوش مصنوعی ، دانشکده علوم و تحقیقات بوشهر