بهبود عملکرد عامل بکمک یادگیری تقویتی فازی در یک سیستم چند عاملی

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,991

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI14_239

تاریخ نمایه سازی: 26 مهر 1387

چکیده مقاله:

دراین تحقیق ابتدا با یادگیری تقویتی عامل را در یک محیط دو بعدی شبیه سازی فوتبال،آموزش دادیم.سپس به منظور کاهش چالش های موجود در الگوریتم های یادگیری تقویتی و بالا بردن سرعت یادگیری، الگوریتمی پیشنهاد دادیم. در این الگوریتم از ترکیب سیستم استنتاج فازی و یادگیری تقویتی استفاده شده است. در آخر با مقایسه نتایج بدست آمده از سه تکنیک تیم ،UvA یادگیری تقویتی و الگوریتم پیشنهادی می توان بهبود عملکرد بازیکن شوت زننده را در الگوریتم پیشنهادی نشان داد.

نویسندگان

فهیمه فرحناکیان

دانشکده مهندسی کامپیوتر- دانشگاه علم و صنعت ایران

ناصر مزینی

دانشکده مهندسی کامپیوتر- دانشگاه علم و صنعت ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ Watkins C.J.C.H and Dayan.P, "Q-Learning", Machine Learning, Vol.8, pp.279-292, ...
  • Chen .M, Dorer.K, Foroughi.E, Heintz.F, Huang.Z, Kapetanakis.S, Kostiadis.K, Kummeneje.J, Murray.J, ...
  • Kitano H., Veloso M., Matsubara H., Tambe M., Coradeschi S., ...
  • Stone.P , Sutton.R.S and Kuhlmann.G _ . Rei nforcement Learning ...
  • Nguyen H.T. & Walker E.A., A First Course in:Fuzzy Logic, ...
  • Mitchell T.M., Machine Learning, McGraw-Hill Press, International Edition, 1997. ...
  • Sutton.R.S and Barto.A.G, _، Rei nforcement Learning. An Introduction?, MIT ...
  • Kok J., Vlassis N. & Groen F., ،UvA Trilearn 2003 ...
  • Kok J., Vlassis N. & Groen F., "Toward an optimal ...
  • نمایش کامل مراجع