ارائه الگوریتم بهینه سازی «انطباق پیش رو» برای آموزش مدل های مورد استفاده در یادگیری عمیق

سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 157

فایل این مقاله در 27 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_KARFN-21-3_003

تاریخ نمایه سازی: 12 آذر 1403

چکیده مقاله:

یادگیری عمیق یکی از زیرمجموعه های یادگیری ماشینی است که به طور وسیع در زمینه هوش مصنوعی، مانند پردازش زبان طبیعی و بینایی ماشین بکار می رود. قطعه بندی تصویر به عنوان زیر مجموعه ای از بینایی ماشین، یکی از رایج ترین مراحل پردازش تصویر دیجیتال است، که یک تصویر دیجیتال را به قطعات مختلف تقسیم می کند. در این پژوهش یک روش نوین مبتنی بر یادگیری عمیق برای قطعه بندی تصاویر ارائه شده است. برای بهینه سازی مدل پیشنهادی الگوریتم "انطباق پیش رو"به عنوان یک الگوریتم بهینه سازی جدید معرفی و مورد استفاده قرار گرفت. در الگوریتم های بهینه سازی پیشین مهم ترین عامل کاهش دقت، استخراج ویژگی های سطح پایین تصاویر و عدم کاهش فاصله معنایی میان ادراک انسان و این ویژگی هاست. در این مطالعه با کمک یادگیری عمیق، استخراج سلسله مراتبی و عمیق ویژگی از تصاویر انجام شد. الگوریتم بهینه سازی "انطباق پیش رو"، که در آن از یک مدل عمیق مبتنی بر شبکه عصبی همگشتی استفاده شده، ویژگی های سطح بالاتری را استخراج کرده و به دقت مطلوبی دست یافته است. با بکارگیری تکنیک Nestrov در محاسبه گرادیان توسط الگوریتم پیشنهادی بهترین نتیجه یعنی دقت ۱/۹۱ برای معیار شباهت دایس بدست آمد. برتری دیگر این الگوریتم نسبت به سایر روش ها، استفاده از محاسبات غیر پیچیده است. مقایسه الگوریتم بهینه سازی پیشنهادی با سایر روش های معمول بکار رفته، نشان دهنده بهبود عملکرد این شبکه بر روی مجموعه داده های نسبتا بزرگ است. همچنین عملکرد دقیق تر این شبکه، در نتیجه ی استخراج سلسله مراتبی و عمیق آن، نسبت به روش های دیگر است.

کلیدواژه ها:

یادگیری عمیق ، بهینه سازی ، الگوریتم های بهینه سازی ، مدل های عمیق ، الگوریتم انطباق پیش رو

نویسندگان

فرناز حسینی

گروه مهندسی کامپیوتر، دانشگاه فنی و حرفه ای، تهران، ایران

حامد سپهرزاده

گروه مهندسی کامپیوتر، دانشگاه فنی و حرفه ای، تهران، ایران

معصومه خیری

گروه مهندسی کامپیوتر، دانشگاه فنی و حرفه ای، تهران، ایران