توسعه نرم افزارهای مقاوم در برابر حملات هوش مصنوعی چارچوب نرم افزارهای مقاوم برابر حملات مبتنی بر هوش مصنوعی همدون حملات adversarial

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 31

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCAEC07_135

تاریخ نمایه سازی: 17 خرداد 1405

چکیده مقاله:

حملات adversarial به تغییرات جزئی در ورودی های مدل های یادگیری ماشین اطلاق می شود که هدف آن فریب مدل ها و کاهش دقت پیش بینی های آنها است این نوع حملات یکی از بزرگترین چالش ها در امنیت سیستم های هوش مصنوعی محسوب می شود. هدف از این پژوهش بررسی روش های مختلف مقاوم سازی مدل های یادگیری ماشین در برابر این حملات و ارزیابی تاثیر آنها بر دقت و عملکرد مدل ها است. روش تحقیق این پژوهش تجربی است که در آن ابتدا حملات adversarial مانند GSM و PGD شبیه سازی شده و سپس تکنیک های مقاوم سازی شامل آموزش با داده های regularization adversarial و distillation بر روی مدل های یادگیری ماشین اعمال شد. مدل ها پس از اعمال این تکنیک ها ارزیابی شدند و عملکرد آنها در مواجهه با حملات adversarial مقایسه گردید. معیارهای ارزیابی شامل دقت (accuracy) مقاومت (robustness) و زمان آموزش بودند. یافته ها نشان دادند که مدل های مقاوم سازی شده با استفاده از روش های مختلف، به طور قابل توجهی در برابر حملات adversarial مقاوم تر از مدل های بدون مقاوم سازی بودند. مدل های آموزش دیده با داده های adversarial دقت %۹۲ را در برابر حملات نشان دادند در حالی که مدل های بدون مقاوم سازی تنها ۷۵٪ دقت داشتند همچنین استفاده از تکنیک های regularization و distillation باعث افزایش دقت مدل ها به ۸۸ و ۹۰٪ شد. با این حال تکنیک های مقاوم سازی زمان آموزش مدل ها را افزایش دادند به ویژه در استفاده از distillation که زمان آموزش را به ۷۰ دقیقه رساند نتیجه گیری این پژوهش این است که ترکیب چندین روش مقاوم سازی می تواند به طور موثری مقاومت مدل ها را در برابر حملات adversarial افزایش دهد. همچنین بهبود روش های مقاوم سازی و یافتن تعادل میان دقت و زمان آموزش همچنان از چالش های اصلی در این زمینه باقی می ماند.

کلیدواژه ها:

حملات adversarial ، مقاوم سازی مدل های یادگیری ماشین ، آموزش regularization adversarial

نویسندگان

مهدی سروری

کارشناسی نرم افزار، کامپیوتر دانشگاه شهید باهنر کرمان، ایران