تاثیرخطای سیگنال تقویت در یادگیری تقویتی
- سال انتشار: 1383
- محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
- کد COI اختصاصی: ACCSI10_095
- زبان مقاله: فارسی
- تعداد مشاهده: 913
نویسندگان
قطب کنترل و سیستمهای هوشمند گروه برق و کامپیوتر دانشگاه تهران
چکیده
طراحی سیگنال تقویت یکی از مسائل اساسی در یادگیری تقویتی است طراح عامل هوشمند می تواند با انتخاب سیگنال مناسب عامل را به سمت یادگیری رفتار مورد نظر سوق دهدبا این وجو د تاکنون روش کلی ای برای طراحی چنان سیگنالی وجود نداشته است و در بسیاری ازموارد آنچه در عمل طراحی می شود با مطلوب تفاوت دارد دراین مقاله تفاوت این دو سیگنال بصورت خطایی با نرم محدود درنظر گرفته شده و اثر آن برتابع ارزش و همچنین تاثیرش بررفتار عامل به صورت کرانه هایی مشخص شده است درنهایت نتایج بدست آمده در مساله ای مورد آزمون واقع شده اند.کلیدواژه ها
یادگیری تقویت، خطا در سیگنال تقویت، یادگیری با عدم قطعیتمقالات مرتبط جدید
- tGraph_PheroWalk : یک الگوریتم جدید برای یادگیری بازنمایی گراف های پویا
- Efficient Triple Modular Redundancy for Reliability Enhancement of DNNs Using Explainable AI
- مقایسه فناوری CMUT با پیزوالکتریک برای کاربرد در تصویربرداری التراسونیک
- بهبود کنترل دست رباتیک به کمک کنترل کننده تطبیقی فازی-PID
- طراحی و شبیه سازی آنتن تک قطبی چند بانده فشرده با تغذیه ریز نوار برای بهبود عملکرد در باندهای فرکانسی ۲.۵، ۳.۸، ۵.۴ و ۶.۹ گیگاهرتز
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.