دسته بندی تصاویر با استفاده از نگاشت فعالسازی کلاس و مدلهای یادگیری عمیق CNN

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 19

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITAIC01_027

تاریخ نمایه سازی: 14 مرداد 1404

چکیده مقاله:

شبکه های عصبی کانولوشنال (CNN) برای طبقه بندی تصاویر به کار می روند و روش های مبتنی بر نقشه فعال سازی کلاس (CAM) برای توضیح پیش بینی های این مدل ها استفاده می شوند. این روش ها با تولید نقشه های حرارتی تصویری، مناطق مهم تصویر را برای پیش بینی ها برجسته می کنند و شفافیت و اعتماد به مدل را افزایش می دهند. اگرچه اکثر روش های CAM نقشه های توضیحی را از ترکیب خطی نقشه های فعال سازی CNN تولید می کنند، اما فاقد مبنای نظری برای تخصیص ضرایب هستند. از طرفی روش های CAM در طول تبدیل های مکانی مانند چرخش ناسازگار هستند. برای به حداقل رساندن چنین ناسازگاری، در این مقاله یک تابع زیان پیشنهاد شده است که فاصله بین نقشه های توضیح مبتنی بر CAM از تصویر اصلی و تصویر تبدیل شده را منظم می کند. همچنین یک روش LIFT-CAM مبتنی بر DeepLIFT پیشنهاد شده که مقادیر SHAP را با سرعت و دقت بالا تخمین می زند. LIFT-CAM در مقایسه با روش های قبلی CAM، عملکرد بهتری در جنبه های کیفی و کمی دارد و توضیحات دقیق تری برای پیش بینی های CNN ارائه می دهد. این رویکرد به بهبود شفافیت و قابلیت اعتماد مدل های یادگیری عمیق کمک می کند.

نویسندگان

ابراهیم لیراوی دیلمی

دانشجوی کارشناسی ارشد کامپیوتر، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی ، موسسه آموزش عالی لیان ، بوشهر ، ایران

حسین مومن زاده

دکتری برق مخابرات، گروه مهندسی برق، دانشکده فنی و مهندسی ، موسسه آموزش عالی لیان ، بوشهر ، ایران

نوشین ربیعی

دکتری برق مخابرات، گروه مهندسی برق، دانشکده فنی و مهندسی ، موسسه آموزش عالی لیان ، بوشهر ، ایران