ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,738

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC02_042

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

در این مقاله یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت کنترل زمانبندی چراغهای راهنما پیشنهاد شده است. در الگوریتم های معمولی یک عامل منفرد یاد می گیرد که در طول چند اپیزود به یک هدف برسد. اگر مسئله یادگیری پیچیده باشد آنگاه ممکن است زمان محاسباتی بیشتری برای رسیدن به یک خط مشی بهینه صرف شود. در حالی که برای مسائل بهینه سازی ، روشهایی همانند الگوریتم ژنتیک و بهینه سازی گروه ذرات قادرند تا راه حل بهینه سراسری را برای چند تابع با فضای راه حل بزرگ و با سرعت بیشتر پیدا کنند. دراین مقاله ما از الگوریتم بهینه سازی گروه ذرات برای پیدا کردن خط مشی بهینه استفاده می کنیم. در این روش، عاملهای چندگانه با دو استراتژی بطور همزمان یاد می گیرند : یکی یادگیری انفرادی و دیگری یادگیری در طول مبادله اطلاعات، در استراتژی اخیر، هر عامل اطلاعات مربوط به ترافیک را به عاملهای مجاور می فرستد و هر عامل با توجه به اطلاعات دریافت شده از عاملهای دیگر و نیز اطلاعات خودش خط مشی بهینه را یاد می گیرد.

کلیدواژه ها:

یادگیری تقویتی ، بهینه سازی گروه ذرات ، مدیریت ترافیک