یادگیری تقویتی با استفاده از نقشه های خودسازمان ده رشد یابنده

  • سال انتشار: 1386
  • محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران
  • کد COI اختصاصی: ICEE15_267
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1660
دانلود فایل این مقاله

نویسندگان

حسام منتظری

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر

سجاد مرادی

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر

رضا صفابخش

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر

چکیده

این مقاله ارائه و تعمیم فضای پیوسته وضعیت و عمل را در مساله یادگیری تقویتی بررسی می کند. مدل پیشنهادی فضای وضعیت و عمل روش تقویتی را با استفاده از نقشه های خود سازمان ده رشد یابنده ارائه می کند. نقشه های خود سازمان ده رشد یابنده، تقریب فضای مساله را با حذف و اضافه کردن نورون انجام می دهند. نشان داده شده است که نقشه های رشد یابنده عملکرد بهتری نسبت به نقشه خود سازمان ده استاندارد در حفظ توپولوژی ، کاهش خطای کوانتیزاسیون ، و تقریب توزیع نا ایستا دارند. پیش از این یادگیری تقویتی با استفاده از نقشه های خود سازمان ده استاندارد مورد استفاده قرار گرفته بود، اما علی رغم مزیت نقشه های خود سازمان ده رشد یابنده به نقشه خود سازمان ده استاندارد، ترکیب یادگیری تقویتی با نقشه های خود سازمان ده رشد یابنده به دلیل تعداد متغیر نورون های آن امکانپذیر نبود. در این مقاله الگوریتم یادگیری تقویتی جدیدی مبتنی بر این نوع نقشه ها ارائه شده است که دارای جدول کیو رشد یابنده است که در اننحوه مقدار دهی اولیه، رشد، و بروز رسانی جدول کیومورد بررسی قرار گرفته است. نتایج آزمایشات تجربی که در برکاردی از رباتیک، حاکی ازموفقیت روش ارائه شده است.

کلیدواژه ها

تعمیم ، فضای وضعیت و عمل پیوسته ، نقشه های خود سازمان ده رشد یابنده ، یادگیری تقویتی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.