شکل دهی پاداش با استفاده از کنترل کننده فازی در سیستم های چندعامله

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 823

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICS12_116

تاریخ نمایه سازی: 11 مرداد 1393

چکیده مقاله:

در این مقاله از کنترل کننده فازی 1 استفاده کرده ایم تا شکل دهی پاداش 2 را بهبود ببخشیم. شکل دهی پاداش یکی از روش هایی که برای سرعت بخشیدن به همگرایی و استفاده از اطلاعات موجود از آن استفاده می شود. یکی از مشکلات این روش به کارگیری درست این اطلاعات برای بدست آوردن خروجی صحیح است. از آنجا که ویژگی فازی به کار گیری درست دانش انسانی است پس راه حل مناسب استفاده از فازی است است. این روش بر روی یک محیط ماز 3 اعمال شده است . نتایج حاکی از شکل دهی درست پاداش و افزایش سرعت همگرایی است

کلیدواژه ها:

شکل دهی پاداش ، سیستم های چند کارگزاره 4 ، کنترل کننده فازی

نویسندگان

مریم صادقلو

قطب علمی رایانش نرم و پردازش هوشمند اطلاعات، دانشگاه فردوسی مشهد ، مشهد

محمدرضا اکبرزاده توتونچی

قطب علمی رایانش نرم و پردازش هوشمند اطلاعات، دانشگاه فردوسی مشهد ، مشهد

محمدباقر نقیبی سیستانی

گروه مهندسی برق دانشگاه فردوسی مشهد، مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • S.Sutton & A. G. Barto, Reinforcemet Learning : An Introduction, ...
  • M. Wooldridge. An Introduction to MultiAgent Systems. John Wiley and ...
  • V. Gullapalli and A. G. Barto, "Shaping as a method ...
  • J. Randlov and P Alstrom, "Learning to drive a bicycle ...
  • M. Grzes and D. Kudenko, "Plan-based reward shaping for reinforcement ...
  • _ _ Analysis of reward shaping in reinforcement learing, " ...
  • S. Devlin and D Kudenko, "Theoretical consideration of potential-based reward ...
  • S. Devlin and D Kudenko, "Dynamic potential-based ...
  • M. Marashi and A khalilian, " Automatic Reward Shaping in ...
  • A. Y. Ng, D. Harada, and S. J. Russell, "Policy ...
  • _ _ _ initialization are equivalent, " JAIR, vol. 19, ...
  • _ _ _ Conference on Machine learning, page 608. ACM, ...
  • M. Matari'c. Reinforcemen learning in the multi-robot domain. Autonomous Robots, ...
  • نمایش کامل مراجع