بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی
سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 107
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_TJEE-49-3_014
تاریخ نمایه سازی: 27 تیر 1402
چکیده مقاله:
این مقاله به موضوع انتقال یادگیری در محیطهایی که بعضی از ویژگیهای آن مشترک است میپردازد. چالش اصلی در این مبحث، نحوه انتقال دانش بهدستآمده از محیط مبدا به محیط مقصد است. در ایده ارائهشده با در نظرگرفتن ویژگیهای مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدا بهدست میآید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده میشود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیشبینی شبکه عصبی - فازی و مقدار بهدستآمده در خود آن محیط استفاده میشود. به عبارت دیگر با توجه به آموزش انجام شده در محیط مبدا، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریبزدهشده توسط شبکه عصبی - فازی و مقدار بهدست آمده از الگوریتم یادگیری در آن محیط بهدست میآید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفاده شده است. نتایج حاصل از ایده ارائه شده، حاکی از افزایش چشمگیر سرعت یادگیری میباشد.
کلیدواژه ها:
نویسندگان
فاطمه سعادت جو
دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
عرفان قندهاری
دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :