بهره گیری از الگوریتم بهینه سازی پروگزیمال در یادگیری تقویتی جهت تشخیص پویا و خنثی سازی حملات مسمومیت موتورهای جستجو برای امنیت سایبری

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 119

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

INDEXCONF07_006

تاریخ نمایه سازی: 28 مهر 1404

چکیده مقاله:

حملات مسمومیت موتورهای جستجو (SEO Poisoning) یکی از تهدیدات رو به رشد در حوزه امنیت سایبری است که با دستکاری نتایج موتورهای جستجو کاربران را به سمت وب سایتهای مخرب هدایت می کند. در این پژوهش، یک روش نوین مبتنی بر یادگیری تقویتی با استفاده از الگوریتم بهینه سازی سیاست پروگزیمال (PPO) برای تشخیص و خنثی سازی این حملات پیشنهاد شده است. مدل پیشنهادی در یک محیط شبیه سازی شده با احتمالی حدود ۳۰ درصد وقوع حمله آموزش داده شده و عملکرد آن با معیارهایی نظیر دقت، F-Score، نرخ کاذب مثبت و منفی و زمان پاسخ ارزیابی شده است. بر اساس نتایج بدست آمده، مدل PPO با میانگین پاداش حدود ۱۲۷۰ و زمان پاسخ بسیار سریع، پتانسیل بالایی برای کاربردهای زمان واقعی دارد. از طرف دیگر، مقایسه با روش های پایه مانند SVM و RNN نشان می دهد که این روش ها در دقت و عملکرد بهتری دارند، اما الگوریتم PPO از نظر زمان پاسخ و عدم نیاز به داده های برچسب دار برتری دارد. در نهایت، پیشنهادات برای بهبود شامل تنظیم، پاداش ها، افزایش گام های آموزشی و استفاده از داده های واقعی است.

نویسندگان

پریسا سعیدی قلعه

دانشجوی دکتری، مهندسی کامپیوتر دانشگاه آزاد اسلامی ارومیه

امین بابازاده سنگر

استادیار مهندسی فناوری اطلاعات و کامپیوتر دانشگاه آزاد اسلامی ارومیه