ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه
محل انتشار: دومین کنفرانس داده کاوی ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,738
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC02_042
تاریخ نمایه سازی: 14 فروردین 1388
چکیده مقاله:
در این مقاله یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت کنترل زمانبندی چراغهای راهنما پیشنهاد شده است. در الگوریتم های معمولی یک عامل منفرد یاد می گیرد که در طول چند اپیزود به یک هدف برسد. اگر مسئله یادگیری پیچیده باشد آنگاه ممکن است زمان محاسباتی بیشتری برای رسیدن به یک خط مشی بهینه صرف شود. در حالی که برای مسائل بهینه سازی ، روشهایی همانند الگوریتم ژنتیک و بهینه سازی گروه ذرات قادرند تا راه حل بهینه سراسری را برای چند تابع با فضای راه حل بزرگ و با سرعت بیشتر پیدا کنند. دراین مقاله ما از الگوریتم بهینه سازی گروه ذرات برای پیدا کردن خط مشی بهینه استفاده می کنیم. در این روش، عاملهای چندگانه با دو استراتژی بطور همزمان یاد می گیرند : یکی یادگیری انفرادی و دیگری یادگیری در طول مبادله اطلاعات، در استراتژی اخیر، هر عامل اطلاعات مربوط به ترافیک را به عاملهای مجاور می فرستد و هر عامل با توجه به اطلاعات دریافت شده از عاملهای دیگر و نیز اطلاعات خودش خط مشی بهینه را یاد می گیرد.
کلیدواژه ها:
نویسندگان