روشی جدید برای افزایش سرعت یادگیری تقویتی توزیع شده ، IBSAQL
محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 984
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS11_101
تاریخ نمایه سازی: 14 مهر 1392
چکیده مقاله:
در این مقاله، الگوریتم جدیدی مبتنی بر یادگیر تقویتی توزیع شده، برای افزایش سرعت یادگیری، در الگوریتم های یادگیری تقویتی ارائه شده است. در روش پیشنهادی، به ازای هر حالت از محیط، به تعداد اعمال مجاز آن حالت، عامل مجازی در نظر گرفته شده است و همچنین یک تابع بهبود یافته ی جدید برای انتخاب عمل در هر حالت پیشنهاد شده است، که موجب تسریع در الگوریتم های مبتنی بر Q-learning می شود. از الگوریتم مذکور برای حل بازی های مارکوف استفاده شده است. برتری تابع پیشنهادی با انجام آزمایشات متعدد نشان داده است. نتایج به دست آمده در آزمایش ها نشان می دهد، که الگوریتم پیشنهادی از لحاظ رعت رسیدن به پاسخ بهینه و میانگین پاداش های به دست آمده، دارای کارایی بسیار بالایی به روش های قبلی است
کلیدواژه ها:
نویسندگان
سارا اسفندیاری
دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین
سمیرا داور قلاتی
دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین
مهدیه اسفندیاری
دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :