تشخیص سلسله مراتبی اشیا در تصویر به وسیله شبکه های عصبی کانولوشنی

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 151

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF19_041

تاریخ نمایه سازی: 28 خرداد 1402

چکیده مقاله:

امروزه تشخیص اشیا یکی از پرکاربردترین حوزه های بینایی ماشین است. در این پژوهش، یکی از مدلهای بسیار پیشرفته و به روز تشخیص سلسله مراتبی اشیا در تصویر به وسیله شبکه های عصبی کانولوشنی، یعنی فناوری YOLO مورد بررسی قرار گرفته است. YOLO یک سیستم بلادرنگ و درعین حال دقیق تشخیص شی است که تاکنون رسما تا نسخه سوم بهبود یافته است. این پژوهش، میانگین دقت تشخیص اشیا موجود در تصاویر را نسبت به سومین نسخه رسمی YOLO بهبود و افزایش داده است. اولین نوآوری در این پژوهش استفاده از داده افزایی است. در ابتدا، تصاویر در زوایای مختلف و به صورت تصادفی تلفیق شدند و جنبه های مختلفی از اشیا درون تصویر آموزش دیدند و مدل پیشنهادی بر اساس الگوهای آموزشدیده، قادر به تشخیص بهتری از شی یا اشیا درون تصویر و مطابقت آنها با کلاسهای موجود در مجموعهداده پاسکال شد. سپس با استفاده از تابع فعالسازی Leaky Relu بهجای تابع فعالسازی Relu و همچنین با به کار بردن اشتراک بر اجتماع تعمیم یافته (GIOU) بهجای اشتراک بر اجتماع معمولی (IOU) در لایه های کانولوشونی در شبکه Darknet-۵۳ موجود در YOLO نسخه پایه، معیار میانگین دقت در روش پیشنهادی در طی مراحل تکرار آموزش عمیق از مقدار میانگین دقت ۰.۷۱ در تکرار دهم آموزش به حداکثر مقدار خود در تکرار هشتادم برابر با ۰.۷۹۳ رسید. رشد مقادیر میانگین دقت در مراحل تکرار، نشان میدهد که این پژوهش، مقدار میانگین دقت متوسط تشخیص اشیا موجود در تصاویر در YOLO نسخه سوم را به مقدار ۵ درصد بهبود داده است و از %۳/۷۴ در YOLO نسخه سوم به مقدار %۳/۷۹ رسیده است که علاوه بر تمام نسخه های پیشین YOLO، نسبت به بسیاری از روشهای موجود و پیشرو در زمینه تشخیص اشیا در تصاویر نیز رشد داشته است.

کلیدواژه ها:

تشخیص اشیا ، شبکه های عصبی کانولوشنی ، مجموعه داده پاسکال ، YOLO

نویسندگان

فرشته مناف زاده هیر

دانشجو کارشناسی ارشد هوش مصنوعی، دانشگاه سمنان