روشی یادگیر برای ترکیب وظایف در یادگیری تقویتی پیمانه ای

  • سال انتشار: 1391
  • محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
  • کد COI اختصاصی: ICS11_235
  • زبان مقاله: فارسی
  • تعداد مشاهده: 929
دانلود فایل این مقاله

نویسندگان

سید محمد حسین میرهاشمی

دانشگاه علم و صنعت ایران

ناصر مزینی

دانشگاه علم و صنعت ایران

محمدرضا جاهد مطلق

دانشگاه علم و صنعت ایران

چکیده

دسته ای از روش های یادگیری تقویتی سعی می کنند مسائل پیچیده را با تجزیه به مسائل کوچکتر حل کنند. به این صورت که هدف اصلی را به تعدادی زیرهدف یا وظیفه می شکنند و هریک را توسط یک یادگیر فرا می گیرند، سپس به ترکیب این وظایف یادگرفته شده می پردازند. بیشتر این روش ها به علت عدم استفاده مناسب از دانش موجود در این پیمانه های فراگرفته شده، در ترکیب آن ها با مشکل روبرو می شوند، و در نتیجه نمی توانند به خوبی به هدف اصلی دست بیابند. در این مقاله روشی یادگیر برای ترکیب وظایف ارائه شده است که به علت راهکار مناسبی که برای ترکیب پیمانه ها ارائه می کند، به جواب مناسبی برای مسئله ی اصلی می رسد. پیاده سازی این روش در یک مسئله که از منظر یادگیری تقویتی بسیار بزرگ و پیچیده است، عملکرد بسیار مناسبی از خود نشان داده و به کارایی بسیار بالایی می رسد

کلیدواژه ها

ترکیب پیمانه ها، یادگیری تقویتی پیمانه ای، یادگیری تقویتی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.