تاثیرخطای سیگنال تقویت در یادگیری تقویتی

سال انتشار: 1383
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 812

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI10_095

تاریخ نمایه سازی: 25 آذر 1390

چکیده مقاله:

طراحی سیگنال تقویت یکی از مسائل اساسی در یادگیری تقویتی است طراح عامل هوشمند می تواند با انتخاب سیگنال مناسب عامل را به سمت یادگیری رفتار مورد نظر سوق دهدبا این وجو د تاکنون روش کلی ای برای طراحی چنان سیگنالی وجود نداشته است و در بسیاری ازموارد آنچه در عمل طراحی می شود با مطلوب تفاوت دارد دراین مقاله تفاوت این دو سیگنال بصورت خطایی با نرم محدود درنظر گرفته شده و اثر آن برتابع ارزش و همچنین تاثیرش بررفتار عامل به صورت کرانه هایی مشخص شده است درنهایت نتایج بدست آمده در مساله ای مورد آزمون واقع شده اند.

کلیدواژه ها:

یادگیری تقویت ، خطا در سیگنال تقویت ، یادگیری با عدم قطعیت

نویسندگان

امیرمسعود فرهمند

قطب کنترل و سیستمهای هوشمند گروه برق و کامپیوتر دانشگاه تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • B. R. Hergenhahn and M. H. Olson, An Introduction _ ...
  • R S. Sutton, "Learming to Predict by The Method of ...
  • Dayan, "Q-Learming, " Machine Learning, 8(3), 1992, pp. ب [3] ...
  • T. Jaakkola, M. I. Jordan, and S. Singh, _ the ...
  • L. P. Kaelbling and M. L. Littman, "Reinforcemet Learming: A ...
  • R S. Sutton, and A. G. Barto, Reinforcement Learning: _ ...
  • Trans formations: Theory and Application to Reward Shaping, " Proceedings ...
  • R. J. Williams and L. C. Baird, "Tight Performance Bounds ...
  • S. Singh and R. Yee, -An Upper Bound _ the ...
  • Hierarchy Leaming in a Behavior-based System using Reinforcement Leaming, " ...
  • A. Y. Ng, D. Harada, and S. Russell, "Policy Invariance ...
  • A. M. Farahmand, M. Nili Abmadabadi, and B. Najar Araabi, ...
  • نمایش کامل مراجع