بکارگیری یادگیری تقویتی (RL) در دفاع سایبری پویا با تاکید بر توانایی آن برای افزایش اثربخشی اقدامات امنیتی و تعمیم نتایج آن به کشورهای در حال توسعه
سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 90
فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ECDS11_078
تاریخ نمایه سازی: 23 اردیبهشت 1404
چکیده مقاله:
یادگیری تقویتی (RL) یک الگوی یادگیری است که در آن یک عامل یاد می گیرد که با تعامل با یک محیط تصمیم های متوالی بگیرد. عامل براساس اقدامات خود بازخوردی را در قالب پاداش یا جریمه دریافت می کند. هدف یادگیری تقویتی یادگیری یک خط مشی بهینه است که پاداش های تجمعی را در طول زمان به حداکثر می رساند. یادگیری تقویتی به عنوان یک مولفه مهم در توسعه استراتژی های دفاعی سایبری پویا ظهور کرده است. از آنجا که تهدیدهای سایبری به طور فزاینده ای پیچیده و سازگار می شوند، مکانیزم های دفاعی ایستا یا استاتیک سنتی اغلب دچار کمبود می شوند. این مقاله به بررسی کاربرد یادگیری تقویتی در دفاع سایبری پویا با تاکید بر پتانسیل آن برای افزایش اثربخشی اقدامات امنیتی می پردازد. این مقاله طبق اطلاعات به دست آمده از مطالعات موردی، چاچوب های نظری و سایت های مختلف از جمله گوگل اسکولار و غیره به بررسی کاربرد یادگیری تقویتی در دفاع سایبری پویا با تاکید بر پتانسیل آن برای افزایش اثربخشی اقدامات امنیتی آن در کشورهای پیشرفته می پردازد و نتایج آن قابلیت تعمیم به کشورهای در حال توسعه را دارا می باشد. در دفاع سایبری پویا، الگوریتم های یادگیری تقویتی می توانند رفتار حمله کننده ها را مدل سازی و پیش بینی نموده و امکان توسعه استراتژی های دفاعی پاسخگو را فراهم آورند. با شبیه سازی سناریوهای مختلف حمله و یادگیری از آن ها، سیستم های یادگیری تقویت می توانند اقدامات دفاعی بهینه را در زمان واقعی شناسایی نموده و در نتیجه تاثیر حملات سایبری را به حداقل برسانند. این رویکرد به ویژه در رسیدگی به آسیب پذیری های روز صفر و حملات پیچیده چند مرحله ای که دفاع های سنتی ممکن است به سرعت تشخیص ندهند، مفید است. علاوه بر این، استراتژی های مبتنی بر یادگیری تقویتی را می توان در حوزه های مختلف امنیت سایبری از جمله سیستم های تشخیص نفوذ (IDS)، تشخیص بدافزار و امنیت شبکه ادغام کرد. برای مثال، در سیستم های تشخیص نفوذ، یادگیری تقویتی می تواند فرآیند تشخیص را با یادگیری مداوم از الگوهای ترافیک شبکه و تطبیق با اشکال جدید نفوذها بهینه کند. به طور مشابه، در تشخیص بدافزار، یادگیری تقویتی می تواند شناسایی و طبقه بندی نرم افزار مخرب را با تکامل با تاکتیک های مورد استفاده توسط توسعه دهندگان
کلیدواژه ها:
یادگیری تقویتی ، دفاع سایبری ، اثربخشی امنیتی ، کشورهای در حال توسعه ، الگوریتم های یادگیری تقویتی ، استراتژی های دفاعی ، سیستم های تشخیص نفوذ ، تشخیص بدافزار ، امنیت شبکه
نویسندگان
عزت اله بهوندی
معاونت منابع انسانی اداره کل امور مالیاتی تهران جنوب
نعمت اله عالی پور
رئیس گروه حسابرسی مالیاتی خوزستان، دانشجوی دکتری تخصصی حسابداری، دانشگاه آزاد اسلامی واحد شهرکرد