هدایت و کنترل خودمختار ملاقات مداری با شش درجه آزادی با استفاده از فرایادگیری تقویتی و شبکه های ترنسفورمر

سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 41

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_AKT-14-2_005

تاریخ نمایه سازی: 26 آذر 1404

چکیده مقاله:

افزایش تعداد ماهواره ها در مدار پایین زمین، خطر برخورد بین اجسام فضایی را به شدت افزایش داده است. ماموریت های سرویس دهی و حذف زباله های فضایی می توانند با افزایش عمر ماهواره ها و پاکسازی مدارها، این تهدید را کاهش دهند. در این پژوهش، یک رویکرد نوین برای هدایت و کنترل فضاپیما در سناریوهای ملاقات مداری با شش درجه آزادی ارائه شده است که مبتنی بر یادگیری تقویتی فرا-آموزشی و شبکه های ترنسفورمر است. این مدل با کمک شبکه های ترنسفورمر، امکان یادگیری روابط پیچیده زمانی و استنباط اطلاعات پنهان از محیط را برای فضاپیمای تعقیب کننده فراهم می کند. الگوریتم بهینه سازی سیاست مجاورتی (PPO) که برای آموزش مدل به کار گرفته شده، در کنترل پیوسته عملکرد بالایی دارد. نتایج شبیه سازی ها در محیط مجازی نشان می دهند که این رویکرد از لحاظ دقت و پایداری بر معماری های سنتی مانند LSTM برتری دارد. از سوی دیگر تعداد پارامترهای شبکه، خود چالشی مهم در پیاده سازی بر روی سخت افزارها هست که روش پیشنهادی با کاهش محسوس در تعداد پارامترهای شبکه در کنار افزایش انطباق پذیری و بهبود دقت در شرایط متغیر محیطی کمک می کند. این رویکرد می تواند به عنوان راهکاری موثر برای تسهیل ماموریت های سرویس دهی و مدیریت زباله های فضایی مورد استفاده قرار گیرد.

نویسندگان

ایمان محمدزمان

عضو هیئت علمی دانشکده برق دانشگاه صنعتی مالک اشتر

مهرداد محسنی

دانشکده برق و کنترل ، دانشگاه صنعتی مالک اشتر،