تعیین آرایش بهینه یگان ها با استفاده از یادگیری تقویتی چند عاملی در بازی جنگ

سال انتشار: 1389
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 272

فایل این مقاله در 26 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_SAIRAN-1-1_006

تاریخ نمایه سازی: 8 خرداد 1400

چکیده مقاله:

در این مقاله، به مسئله یادگیری تقویتی چندعاملی با کاربرد در باز یجنگ پرداخته شده است. ساختارهای نظامی باعث ایجاد اولویت در اجرای تصمیمات بین عامل های درگیر در صحنه نبرد می شود. حالت های استاتیک تصمیم گیری بین عامل ها در این ساختارهای را می توان در قالب بازی های بسیط بیان کرد. فرآیند مزبور در چارچوب بازیهای مارکوف بسیط مدل شده که عمل مشترک بهینه از طریق محاسبه نقطه تعادل نش کامل زیربازی به دست می آید. با استفاده از مفهوم ارزشهای انجمنی، امکان ایجاد مصالحه در انتخاب عمل بهینه نقطه تعادل نش و اکتشاف عمل های جدید فراهم شده است. شبیه سازی انجام شده بر روی نسخه ساد های از یک باز یجنگ واقعی، علاوه بر تا یید همگرایی، کارآمدی این روش را در بررسی پدیده های مختلف جنگ نشان میدهد

کلیدواژه ها:

بازی جنگ ، یادگیری تقویتی چندعاملی ، مصالحه بین اکتشاف و استخراج ، بازی های مارکوف بسیط ، آرایش بندی

نویسندگان

علی اکرمی زاده

دانشگاه صنعتی امیرکبیر

احمد افشار

دانشگاه صنعتی امیرکبیر.

محمد باقر منهاج

دانشگاه صنعتی امیرکبیر.

سمیرا جعفری

دانشگاه صنعتی امیرکبیر