استفاده از الگوریتم های یادگیری تقویتی برای هدایت خودکار موشک های ضد بالستیک در محیط های غیرقطعی

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 22

فایل این مقاله در 11 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

EDST02_015

تاریخ نمایه سازی: 18 بهمن 1404

چکیده مقاله:

هدایت موشک های ضدبالستیک در محیط های پویا و غیرقطعی (که در آن ها هدف ها با مانورهای پیچیده، سرعت های بالا و عدم قطعیت در موقعیت و سینماتیک حرکت می کنند)، یکی از چالش برانگیزترین مسائل در سامانه های دفاعی هوشمند محسوب می شود. روش های سنتی هدایت مبتنی بر فیلتر کالمن یا قوانین پروانه ای PN در چنین شرایطی با محدودیت های جدی در انعطاف پذیری و تطبیق پذیری مواجه هستند. در این پژوهش، یک چارچوب نوین مبتنی بر یادگیری تقویتی عمیق DRL برای هدایت خودکار موشک های ضدبالستیک ارائه می شود که قادر است در محیط های غیرقطعی، باوجود نویز سنسوری، تاخیر در ارتباط و رفتارهای غیرخطی هدف، به صورت خودمختار تصمیم گیری کند. معماری پیشنهادی از ترکیب شبکه های عصبی عمیق و الگوریتم هایی مانند SAC وPPO بهره می برد تا سیاست هدایتی پایدار، کارآمد و مقاوم در برابر اختلالات را یاد بگیرد.

کلیدواژه ها:

الگوریتم های یادگیری تقویتی ، موشک ضدبالستیک ، هدایت خودکار ، محیط غیرقطعی ، سیستم های دفاعی هوشمند

نویسندگان

کریم انصاری

دانشجوی دکتری مهندسی هوافضا، پژوهشگاه هوافضا،، تهران، ایران

جلال شجاعی

دکتری مدیریت استراتژیک، دانشگاه عالی دفاع ملی، ایران

مهرداد اسکندری

دکتری مدیریت استراتژیک، دانشگاه عالی دفاع ملی، تهران، ایران