روشی جدید برای افزایش سرعت یادگیری تقویتی توزیع شده ، IBSAQL

سارا اسفندیاری; سمیرا داور قلاتی; مهدیه اسفندیاری

روشی جدید برای افزایش سرعت یادگیری تقویتی توزیع شده ، IBSAQL

محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند

سال انتشار: 1391

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 997

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/214683

شناسه ملی سند علمی:

ICS11_101

تاریخ نمایه سازی: 14 مهر 1392

چکیده مقاله:

در این مقاله، الگوریتم جدیدی مبتنی بر یادگیر تقویتی توزیع شده، برای افزایش سرعت یادگیری، در الگوریتم های یادگیری تقویتی ارائه شده است. در روش پیشنهادی، به ازای هر حالت از محیط، به تعداد اعمال مجاز آن حالت، عامل مجازی در نظر گرفته شده است و همچنین یک تابع بهبود یافته ی جدید برای انتخاب عمل در هر حالت پیشنهاد شده است، که موجب تسریع در الگوریتم های مبتنی بر Q-learning می شود. از الگوریتم مذکور برای حل بازی های مارکوف استفاده شده است. برتری تابع پیشنهادی با انجام آزمایشات متعدد نشان داده است. نتایج به دست آمده در آزمایش ها نشان می دهد، که الگوریتم پیشنهادی از لحاظ رعت رسیدن به پاسخ بهینه و میانگین پاداش های به دست آمده، دارای کارایی بسیار بالایی به روش های قبلی است

کلیدواژه ها:

الگوریتم Q-learning ، سیستم های چند عامله ، توزیع بولتزمی ، یادگیری تقویتی

نویسندگان

سارا اسفندیاری

دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین

سمیرا داور قلاتی

دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین

مهدیه اسفندیاری

دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

یازدهمین کنفرانس سیستم‌های هوشمند ایران 9 و 10 اسفند 1391 ...
Kaufmann , San Francisco , CA , pp.5 35-542, 2000. ...
G. Weiss; Multi-agent Systems: "A Modern Approach to Distributed Artificial ...
_ 800 1000 1200 1400 1600 1800 2000 2206 2400 ...
L. Busoniue , R. Babuska and B. D. Schutter , ...
Y. Shoham; "Multi-agent Systems: Algorithmic Game Theoretic and Logical Foundations", ...
, Volume 1, Morgan Kaufmann Publishers Inc. , Stockholm, Sweden, ...
J. Hu and M. P. Wellman, "Nash Q-Learning for General-Sum ...
M. Littman, Markov Games as a Framework for Multi- agent ...
K. Tuyls, A. Nowe, T. Lenaerts, and B. Manderick . ...
L. Matignon, G. Laurent, N. Le Fort-Pit , "Coordination of ...
International Conference _ Machine Learning , San Fransisco , Morgan ...
M. Lauer and M Riedmiller, "Reinforcement Learning for Stochastic cooperative ...
Decentralized Reinforcement Learning in Cooperative Multi-agent Teams _ ' , ...

نمایش کامل مراجع