ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه

وحید چگنی; محمدابراهیم شیری

ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه

محل انتشار: دومین کنفرانس داده کاوی ایران

سال انتشار: 1387

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,805

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/70432

شناسه ملی سند علمی:

IDMC02_042

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

در این مقاله یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت کنترل زمانبندی چراغهای راهنما پیشنهاد شده است. در الگوریتم های معمولی یک عامل منفرد یاد می گیرد که در طول چند اپیزود به یک هدف برسد. اگر مسئله یادگیری پیچیده باشد آنگاه ممکن است زمان محاسباتی بیشتری برای رسیدن به یک خط مشی بهینه صرف شود. در حالی که برای مسائل بهینه سازی ، روشهایی همانند الگوریتم ژنتیک و بهینه سازی گروه ذرات قادرند تا راه حل بهینه سراسری را برای چند تابع با فضای راه حل بزرگ و با سرعت بیشتر پیدا کنند. دراین مقاله ما از الگوریتم بهینه سازی گروه ذرات برای پیدا کردن خط مشی بهینه استفاده می کنیم. در این روش، عاملهای چندگانه با دو استراتژی بطور همزمان یاد می گیرند : یکی یادگیری انفرادی و دیگری یادگیری در طول مبادله اطلاعات، در استراتژی اخیر، هر عامل اطلاعات مربوط به ترافیک را به عاملهای مجاور می فرستد و هر عامل با توجه به اطلاعات دریافت شده از عاملهای دیگر و نیز اطلاعات خودش خط مشی بهینه را یاد می گیرد.

کلیدواژه ها:

یادگیری تقویتی ، بهینه سازی گروه ذرات ، مدیریت ترافیک

نویسندگان

وحید چگنی

محمدابراهیم شیری