شناسایی علائم راهنمایی و رانندگی با استفاده از شبکه ی عصبی GoogLeNet در مجموعهداده ی GTSRB

سال انتشار: 1403
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 169

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICECM08_030

تاریخ نمایه سازی: 7 مهر 1403

چکیده مقاله:

هدف پژوهش حاضر شناسایی علائم راهنمایی و رانندگی با استفاده از شبکه ی عصبی GoogLeNet در مجموعه داده یGTSRB بود. روش پژوهش، بر پایه مطالعات انجام شده بر روی مقالات می باشد که با بکارگیری مجموعه داده GTSRB کهحاوی تعداد زیادی تصاویر علائم راهنمایی رانندگی می باشد، به بررسی روش پیشنهادی مبتنی بر الگوریتم شبکه ی عصبیGoogLeNet پرداخته شد. برای این کار، ابتدا با انجام عملیات پیش پردازش بر روی تصاویر، حذف نویز را انجام داده و با دستهبندی تصاویر در دو قالب تست و آموزش، ( ۷۰ درصد داده ها وارد مرحله آموزش و ۳۰ درصد وارد مرحله آزمایش می شوند)، بهانتخاب و استخراج ویژگی های تصاویر با استفاده از روش پیشنهادی می پردازیم. در نهایت با طبقه بندی ویژگی ها، علائم مربوطه راشناسایی نموده و با استفاده از روش ماتریس آشفتگی، میزان دقت تشخیص را بدست می آوریم.در این پژوهش از روش کتابخانه ایو استفاده از ابزار فیش برداری به منظور گردآوری داده ها استفاده شد و پژوهش فاقد جامعه آماری بوده و از مجموعه داده یGTSRB استفاده می کند همچنین در این پژوهش از زبان برنامه نویسی python به منظور تجزیه وتحلیل داده ها استفاده شد. تصویردر ۴۳ کلاس است. برای SGD ما از تکانه ۰.۹ با کاهش وزن ۰.۰۹۱۸ استفاده کرده ایم.به جای استفاده از ReLU بدون پارامتر،از PReLU برای بالاتر رفتن نتیجه استفاده شده است.معماری گوگلنت (GoogLeNet) در چالش طبقهبندی ILSVRC ۲۰۱۴ در مقام اول قرار گرفته و عملکرد خوبی را از خود نشان داد. درک معماری GoogLeNet برای هر متخصص یادگیری عمیق که بهدنبال درک شبکههای عمیق در حوزه ی بینایی ماشین (Computer Vision) است بسیار اهمیت دارد . گوگلنت (GoogLeNet)اکنون یک معماری اصلی در رایج ترین کتابخانه های یادگیری ماشین (ML) ، مانند TensorFlow ، Keras ، PyTorch و غیره،است . در این رساله جزئیات این معماری را بررسی کرده و متوجه این شدیم که این معماری با ارائهی چندین عنصر جدید به حلمشکل اصلی شبکه های بزرگ، یعنی همان محوشدگی گرادیان Vanishing Gradient، می توان استفاده کرد.

کلیدواژه ها:

علائم راهنمایی و رانندگی ، شبکه ی عصبی GoogLeNet ، GTSRB

نویسندگان

فوزیه مریدی نانگی

کارشناس ارشد رشته کامپیوتر، گرایش نرم افزار،دانشگاه آزاد اسلامی،واحد بندرعباس