استفاده از الگوریتم های یادگیری تقویتی برای هدایت خودکار موشک های ضد بالستیک در محیط های غیرقطعی
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 22
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
EDST02_015
تاریخ نمایه سازی: 18 بهمن 1404
چکیده مقاله:
هدایت موشک های ضدبالستیک در محیط های پویا و غیرقطعی (که در آن ها هدف ها با مانورهای پیچیده، سرعت های بالا و عدم قطعیت در موقعیت و سینماتیک حرکت می کنند)، یکی از چالش برانگیزترین مسائل در سامانه های دفاعی هوشمند محسوب می شود. روش های سنتی هدایت مبتنی بر فیلتر کالمن یا قوانین پروانه ای PN در چنین شرایطی با محدودیت های جدی در انعطاف پذیری و تطبیق پذیری مواجه هستند. در این پژوهش، یک چارچوب نوین مبتنی بر یادگیری تقویتی عمیق DRL برای هدایت خودکار موشک های ضدبالستیک ارائه می شود که قادر است در محیط های غیرقطعی، باوجود نویز سنسوری، تاخیر در ارتباط و رفتارهای غیرخطی هدف، به صورت خودمختار تصمیم گیری کند. معماری پیشنهادی از ترکیب شبکه های عصبی عمیق و الگوریتم هایی مانند SAC وPPO بهره می برد تا سیاست هدایتی پایدار، کارآمد و مقاوم در برابر اختلالات را یاد بگیرد.
کلیدواژه ها:
نویسندگان
کریم انصاری
دانشجوی دکتری مهندسی هوافضا، پژوهشگاه هوافضا،، تهران، ایران
جلال شجاعی
دکتری مدیریت استراتژیک، دانشگاه عالی دفاع ملی، ایران
مهرداد اسکندری
دکتری مدیریت استراتژیک، دانشگاه عالی دفاع ملی، تهران، ایران