تنظیم بهینه پارامترهای شبکه عصبی پیچشی با استفاده از الگوریتم بهینه سازی پنگوئن امپراطور با هدف شناسایی بهتر تصاویر

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 45

فایل این مقاله در 22 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTBC09_114

تاریخ نمایه سازی: 26 خرداد 1405

چکیده مقاله:

شبکه های عصبی پیچشی (CNN) به عنوان یکی از قدرتمندترین معماری های یادگیری عمیق در حوزه بینایی کامپیوتر شناخته می شوند. با این حال عملکرد این شبکه ها به شدت وابسته به تنظیم دقیق پارامترهای آنها از جمله تعداد لایه ها، فیلترها، اندازه هسته، نرخ یادگیری و... است. تنظیم دستی این پارامترها فرآیندی زمان بر، پرهزینه و اغلب غیر بهینه است. این تحقیق به منظور غلبه بر این چالش و یافتن خودکار بهترین پیکربندی شبکه انجام شده است. در این پژوهش، یک روش ترکیبی نوآورانه ارائه شده است که از الگوریتم فراابتکاری پنگوئن امپراطور (EPO) برای بهینه سازی پارامترهای کلیدی یک شبکه CNN استفاده می کند. نوآوری اصلی این کار در به کارگیری الگوریتم نسبتا جدید EPO، که از رفتار هوشمندانه پنگوئن های امپراطور در برابر سرمای شدید الهام گرفته شده است برای حل مسئله بهینه سازی معماری شبکه عصبی می باشد. هر فرد (پنگوئن) در جمعیت، الگوریتم نماینده یک پیکربندی خاص از پارامترهای CNN است و تابع برازش آن بر اساس دقت طبقه بندی روی مجموعه اعتبارسنجی تعریف می شود. روش پیشنهادی بر روی مجموعه داده های استاندارد تشخیص تصویر از جمله ۱۰-CIFAR ارزیابی شده است. نتایج تجربی نشان می دهد که معماری بهینه شده توسط الگوریتم EPO عملکردی برتر از مدل های پایه با پارامترهای تنظیم شده دستی و همچنین مدل های بهینه شده با الگوریتم های کلاسیک دارد. این بهبود عملکرد در معیارهای مختلفی از جمله دقت طبقه بندی (Accuracy)، سرعت همگرایی و کاهش بیش برازش (Overfitting) مشهود بود. یافته های این تحقیق به وضوح اثر بخشی الگوریتم پنگوئن امپراطور را به عنوان یک ابزار قدرتمند و کارآمد برای اتوماسیون فرآیند طراحی و تنظیم معماری شبکه های عصبی پیچشی برای تشخیص بهتر تصاویر نشان می دهد. این روش می تواند به طور گسترده ای در حوزه های مختلفی که مبتنی بر پردازش تصویر هستند از جمله تشخیص پزشکی، سامانه های نظارتی، خودروهای خودران و سنجش از دور به کار گرفته شود تا دقت و قابلیت اطمینان مدل ها را بدون نیاز به دانش گسترده دستی افزایش دهد.

نویسندگان

عباس رنجبر دهقان

دانشکده مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد اهرم، اهرم ایران

علی عباسی

دانشکده مهندسی برق دانشگاه آزاد اسلامی واحد اهرم، اهرم ایران

اشکان معصومی

دانشکده مهندسی برق دانشگاه آزاد اسلامی واحد اهرم، اهرم ایران