طراحی یک عامل یادگیری تقویتی برای نگاشت یادگیری مبتنی بربازخورد محیط

  • سال انتشار: 1396
  • محل انتشار: کنفرانس تحقیقات بازی های دیجیتال؛گرایش ها،فناوری ها و کاربردها
  • کد COI اختصاصی: DGRCONF01_013
  • زبان مقاله: فارسی
  • تعداد مشاهده: 611
دانلود فایل این مقاله

نویسندگان

بابک بادنوا

دانشجوی مقطع کارشناسی ارشد رشته هوش مصنوعی و رباتیکز دانشکده مهندسی کامپیوتر در دانشگاه علم و صنعت ایران

ناصر مزینی

دانشیار گروه هوش مصنوعی و رباتیکز دانشکده مهندسی کامپیوتر در دانشگاه علم و صنعت ایران

چکیده

در بسیاری از وظایف محوله به یک عامل شباهتهایی موجود میباشد که عامل میتواند از این شباهتها استفاده نموده تا نیاز به یادگیری مجدد این مهارتها نداشته باشد، از طرفی دیگر عامل در فرآیند یادگیری یک وظیفه دانشی را نیز کسب مینماید که میتواند از آن در انجام وظایف دیگر استفاده نماید. در این مقاله ما به ارایه روشی برای آموزش یک نگاشت به عامل یادگیری تقویتی با استفاده از بازخوردهای محیطی میپردازیم و نشان خواهیم داد که با شکل دهی به تابع پاداش یک عامل یادگیر تقویتی میتوان به عامل، نگاشت از فضای حالتی به فضای حالت دیگر را آموزش داده و از این نتیجه نیز در انتقال یادگیری تقویتی استفاده نمود. پس از ارایه روش ما به پیادهسازی و آزمون روش ارایه شده بر روی بازیBreakout نمودهایم و مشاهده میکنیم که این عامل به خوبی توانسته است نگاشت اعمال یک عامل را آموزش ببیند

کلیدواژه ها

انتقال یادگیری، یادگیری تقویتی، نگاشت، شکل دهی تابع پاداش

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.