هم زمانی خوشه در بازی های گرافی زمان گسسته ورودی محدود ناشناخته با الگوریتم های یادگیری تقویتی

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 202

فایل این مقاله در 12 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

AISC01_091

تاریخ نمایه سازی: 16 آبان 1401

چکیده مقاله:

در این مقاله، مساله هم زمانی عامل ها در هر خوشه برای بازی های گرافی زمان گسسته چند عاملی با محدودیت ورودی و دینامیک ناشناخته معرفی شده است. هدف طراحی کنترلر برای رسیدن به همزمانی خوشه و اطمینان از بهینگی محلی شاخص عملکرد است. به همین منظور یک الگوریتم بهینه توزیع شده بر مبنای برنامه ریزی پویای تطبیقی تکرار ارزش توسعه داده شده است تا معادلات همیلتون ژاکوبی بلمن را بدون نیاز به هیچ دانشی از دینامیک های سیستم حل کند. برای اجرای الگوریتم ارائه شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-عملگر استفاده می کنند. همچنین یک شناساگر شبکه عصبی برای شناسایی دینامیک های ناشناخته هر عامل اعمال شده است. برای اجتناب از ناپایداری سیستم، محدودیت بر روی ورودی کنترل در روش طراحی در نظر گرفته شده است. همچنین پایداری سیستم حلقه بسته نشان داده شده است. در انتها، نتایج شبیه سازی برای توصیف کارایی روش ارائه شده آورده شده است

کلیدواژه ها:

نویسندگان

زهرا جهان

دانشجوی دکترای مهندسی برق-کنترل دانشگاه سمنان

عباس دیدبان

دانشیار دانشکده مهندسی برق دانشگاه سمنان

مصطفی عرب خابوری

فارغ التحصیل کارشناسی ارشد مهندسی برق-کنترل دانشگاه سمنان