تاثیرخطای سیگنال تقویت در یادگیری تقویتی

طراحی سیگنال تقویت یکی از مسائل اساسی در یادگیری تقویتی است طراح عامل هوشمند می تواند با انتخاب سیگنال مناسب عامل را به سمت یادگیری رفتار مورد نظر سوق دهدبا این وجو د تاکنون روش کلی ای برای طراحی چنان سیگنالی وجود نداشته است و در بسیاری ازموارد آنچه در عمل طراحی می شود با مطلوب تفاوت دارد دراین مقاله تفاوت این دو سیگنال بصورت خطایی با نرم محدود درنظر گرفته شده و اثر آن برتابع ارزش و همچنین تاثیرش بررفتار عامل به صورت کرانه هایی مشخص شده است درنهایت نتایج بدست آمده در مساله ای مورد آزمون واقع شده اند.

کلیدواژه ها:

یادگیری تقویت ، خطا در سیگنال تقویت ، یادگیری با عدم قطعیت

نویسندگان

امیرمسعود فرهمند

قطب کنترل و سیستمهای هوشمند گروه برق و کامپیوتر دانشگاه تهران

مجید نیلی احمدآبادی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

B. R. Hergenhahn and M. H. Olson, An Introduction _ ...
R S. Sutton, "Learming to Predict by The Method of ...
Dayan, "Q-Learming, " Machine Learning, 8(3), 1992, pp. ب [3] ...
T. Jaakkola, M. I. Jordan, and S. Singh, _ the ...
L. P. Kaelbling and M. L. Littman, "Reinforcemet Learming: A ...
R S. Sutton, and A. G. Barto, Reinforcement Learning: _ ...
Trans formations: Theory and Application to Reward Shaping, " Proceedings ...
R. J. Williams and L. C. Baird, "Tight Performance Bounds ...
S. Singh and R. Yee, -An Upper Bound _ the ...
Hierarchy Leaming in a Behavior-based System using Reinforcement Leaming, " ...
A. Y. Ng, D. Harada, and S. Russell, "Policy Invariance ...
A. M. Farahmand, M. Nili Abmadabadi, and B. Najar Araabi, ...

نمایش کامل مراجع

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/128538

شناسه ملی سند علمی:

ACCSI10_095

تاریخ نمایه سازی: 25 آذر 1390

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:

فرهمند، امیرمسعود و نیلی احمدآبادی، مجید،1383،تاثیرخطای سیگنال تقویت در یادگیری تقویتی،دهمین کنفرانس سالانه انجمن کامپیوتر ایران،تهران،https://civilica.com/doc/128538

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1383، فرهمند، امیرمسعود؛ مجید نیلی احمدآبادی)
برای بار دوم به بعد: (1383، فرهمند؛ نیلی احمدآبادی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:

رتبه علمی دانشگاه تهران

نوع مرکز: دانشگاه دولتی

تعداد مقالات: 123,771

در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.

مقالات مرتبط جدید