Learning of a task despite credit assignment problem using deep representation learning with less trials

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 419

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISME25_096

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

In this paper, we present three new methods to accelerate thelearning of a task by deterministic policy gradient algorithm.We focus specifically on learning of a task, which has theCredit Assignment (CA) problem. A Reinforcement Learning(RL) agent is performing this task in high dimensional statespace.The main idea of this paper is to use latent variablesthat deep autoencoders provide, to make a better rewardingsystem. We show that using these new rewards helpstremendously to learn the task in the similar circumstances.The task chosen for the algorithm is Push Recovery (PR) in asimulated environment.

کلیدواژه ها:

Deep Learning- Push Recovery- CreditAssignment Problem- Latent Variable- Rewarding System-Inverse Reinforcement Learning

نویسندگان

MohammadJavad Davari Dolatabadi

MSc Student, Department of Mechatronics Eng., Faculty of New Sciences and Technologies, University of Tehran, Tehran, Iran

Khalil Alipour

Assistant professor, Department of Mechatronics Eng., Faculty of New Sciences and Technologies, University of Tehran, Tehran, Iran

Alireza Hadi

Assistant professor, Department of Mechatronics Eng., Faculty of New Sciences and Technologies, University of Tehran, Tehran, Iran