A new action selection policy in reinforcement learning problems based on fuzzy mappings

In this paper, a new policy in action selection processes related to reinforcement learning problems is presented. This policy in fact is a fuzzy mapping that attributes probabilities of selection to actions proportional to agent s view. Agent s view in this method inculcates to system by a control parameter named ξ that tunes and adjusts very simpler than τ in boltzman softmax method. Intuitiveness and interpretability of the parameter ξ because of using fuzzy system gives us opportunity to contribute the human knowledge in the action selection process. Better performance and more rapid convergence also are two other significant causes for superiority of proposed method.

کلیدواژه ها:

Action Selection Policy ، Softmax ، Fuzzy mapping ، n-Armed bandit problem

نویسندگان

Mohsen Annabestani

Ph.D. student, Department of electrical engineering, Ferdowsi University, Mashhad, Iran

Mohammad Bagher Naghibi

Assistant Professor, Department of electrical engineering, Ferdowsi University, Mashhad, Iran

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/730802

شناسه ملی سند علمی:

ICFUZZYS14_038

تاریخ نمایه سازی: 21 اردیبهشت 1397

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:

Annabestani, Mohsen and Naghibi, Mohammad Bagher,1394,A new action selection policy in reinforcement learning problems based on fuzzy mappings,14th Iranian Conference on Fuzzy Systems,Tabriz,https://civilica.com/doc/730802

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1394, Annabestani, Mohsen؛ Mohammad Bagher Naghibi)
برای بار دوم به بعد: (1394, Annabestani؛ Naghibi)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:

رتبه علمی دانشگاه فردوسی مشهد

نوع مرکز: دانشگاه دولتی

تعداد مقالات: 48,289

در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مقالات پیشنهادی مرتبط

مقالات فوق بر اساس داده کاوی مقالات مطالعه شده توسط پژوهشگران محاسبه شده است.

مقالات مرتبط جدید