تاثیرخطای سیگنال تقویت در یادگیری تقویتی
- سال انتشار: 1383
- محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
- کد COI اختصاصی: ACCSI10_095
- زبان مقاله: فارسی
- تعداد مشاهده: 918
نویسندگان
قطب کنترل و سیستمهای هوشمند گروه برق و کامپیوتر دانشگاه تهران
چکیده
طراحی سیگنال تقویت یکی از مسائل اساسی در یادگیری تقویتی است طراح عامل هوشمند می تواند با انتخاب سیگنال مناسب عامل را به سمت یادگیری رفتار مورد نظر سوق دهدبا این وجو د تاکنون روش کلی ای برای طراحی چنان سیگنالی وجود نداشته است و در بسیاری ازموارد آنچه در عمل طراحی می شود با مطلوب تفاوت دارد دراین مقاله تفاوت این دو سیگنال بصورت خطایی با نرم محدود درنظر گرفته شده و اثر آن برتابع ارزش و همچنین تاثیرش بررفتار عامل به صورت کرانه هایی مشخص شده است درنهایت نتایج بدست آمده در مساله ای مورد آزمون واقع شده اند.کلیدواژه ها
یادگیری تقویت، خطا در سیگنال تقویت، یادگیری با عدم قطعیتمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.