روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی
محل انتشار: ششمین کنفرانس سراسری سیستم های هوشمند
سال انتشار: 1383
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 732
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS06_078
تاریخ نمایه سازی: 18 تیر 1391
چکیده مقاله:
در این مقاله یک روش جدید برای تنظیم پیوسته تمامی وزن های شبکه عصبی با استفاده از الگوریتمSRV اصلاح شده ارائه می گردد که به خطای خروجی کنترلگر و مشتق گیری نیاز ندارد وآموزش تنها با استفاده از یک سیگنال تقویتی اسکالر انجام می پذیرد . مقادیر جدید وزن ها در هر تکرار بصورت تصادفی بر اساس توزیع چگالی احتمال گوسی بدست می آید. تغییرات میانگین و انحراف معیار تابع توزیع احتمال به گونه ای است که با دریافت پاداش احتمال انتخاب مقادیر وزن کنونی تقویت و با دریافت جریمه کاهش می یابد . نتایج شبیه سازی برای مسأله کنترل گاری - اهرم توانایی روش ارایه شده را در تنظیم مناسب وزن های شبکه برای یک فرآیند ناپایدار و ناشناخته نشان می دهد . بطور مختصر مزایای روش ارایه شده را می توان به رهایی ا ز محدودیتهای مشتق گیری، آموزش تنها بر اساس سیگنال تقویتی، حجم کم محاسبات، و درجه اکتشاف مناسب آن نام برد
کلیدواژه ها:
نویسندگان
ولی درهمی
بخش مهندسی برق -دانشکده فنی ومهندسی- دانشگاه تربیت مدرس-
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :