حملات تخاصمی در یک مدل تحلیل احساس متن
محل انتشار: چهارمین کنفرانس بین المللی محاسبات نرم
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 300
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSCG04_040
تاریخ نمایه سازی: 23 اسفند 1400
چکیده مقاله:
شبکه های عصبی عمیق با وجود کارایی و دقت مناسب خود در حل مسائل مختلف، در برابر نمونه های تخاصمی به شدت آسیب پذیر هستند. اینگونه نمونه های مخرب به طور عمدی برای گمراهی و فریب مدل آموزش دیده و همچنین بررسی آسیب پذیری مدل های مختلف شبکه عصبی ساخته می شوند. برای ساخت این نمونه ها در حوزه تصویر تاکنون روش های موفقیت آمیز بسیاری ارائه شده است اما در حوزه متن این روش ها موفقیت چندانی نداشته اند. در این پژوهش یک روش قوی مبتنی بر گرادیان تابع هزینه مدل برای تولید نمونه های تخاصمی متنی ارائه شده و نشان داده شده که می توان با جایگزینی تعداد کمی از کلمات موجود در نمونه های اصلی با کلماتی که بیشترین تاثیر منفی روی تصمیم طبقه بند دارند، نمونه های جدیدی مشابه با نمونه های اصلی اولیه برای فریب طبقه بند تحلیل احساس در سطح کلمه تولید نمود. در نهایت نیز با بهره گیری از ا ین نمونه ها دقت مدل آموزش دیده بررسی شد. روش مورد استفاده در این پژوهش، با دستکاری اندک نمونه های ورودی، موفق به کاهش دقت طبقه بند از ۸۵ درصد به کمتر از ۲ درصد شده است
کلیدواژه ها:
نویسندگان
سحر مکرمی سفیدآب
دانشجو کارشناسی ارشد گروه مهندسی کامپیوتر دانشکده فنی، دانشگاه گیلان
سید ابوالقاسم میرروشندل
دانشیار و عضو هیئت علمی گروه مهندسی کامپیوتر دانشکده فنی، دانشگاه گیلان؛
حمیدرضا احمدی فر
استادیار و عضو هیئت علمی گروه مهندسی کامپیوتر دانشکده فنی، دانشگاه گیلان
مهدی مکرمی سفیداب
کارشناسی ارشد مهندسی فناوری اطلاعات، دانشگاه پیام نور گیلان