ارائه یک رویکرد جدید در راستای تشخیص عابر پیاده مبتنی بر ترکیبی طرح منطقه و قطعه بندی (بخش بندی) معنایی شبکه های عصبی کانولوشن عمیق

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 344

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NREAS03_018

تاریخ نمایه سازی: 16 آبان 1400

چکیده مقاله:

تشخیص عابر پیاده در مورد کلیه سیستم ها و فناوری های مرتبط با مواردی از قبیل کنترل جریان ترافیک ، نظارت هوشمند ویدئویی، شناسایی شخص ، ردیابی افراد ، سیستم های پیشرفته کمک راننده (ADAS) ، رباتیک و مهمترین آنها سیستم های محافظت از عابر پیاده (PPS) موضوعی چالش برانگیز است. در نظارت هوشمند ویدئویی، اطلاعات ضروری را برای شمارش اشیا ، تشخیص رویداد و درک معنایی ویدئوها را فراهم می کند. برای ایجاد یک مسیر پیشرو در تشخیص عابر پیاده ، روشهای طبقه بندی زیادی همانند مدل های تغییر شکل استفاده شده است. اگرچه تلاشهای چشمگیری در این راستا صورت گرفته است ، اما این موضوع هنوز هم به عنوان یک چالش مهم در نظر گرفته می شود که عمدتا ناشی از وجود اشیای کوچک ، پس زمینه های شلوغ و شرایط روشنایی نامطلوب در تصویر است. در این میان، تشخیص عابر پیاده مبتنی بر شبکه عصبی کانولوشن (CNN) پیشرفت های قابل توجهی را به همراه داشته است. فرآیند روش های مبتنی بر CNN عمدتا به دو مرحله "استخراج طرح و طبقه بندی "CNN قابل تقسیم است . ابتدا ، با توجه به الگوریتم سنتی تشخیص عابر پیاده ، طرح های کاندید استخراج می شود . سپس با استفاده از مدل CNN ، این طرح ها به مناطق شامل عابر پیاده یا غیر عابر پیاده تقسیم می شوند. به عبارت دیگر ، هر لایه در CNN از خصوصیات تمایز تشکیل شده است که می توان از آن برای آموزش طبقه بند استفاده نمود. در این مقاله ، یک روش ترکیبی طرح های منطقه و تقسیم بندی معنایی شبکه های عصبی عمیق برای شناسایی عابران پیاده از پایگاه های داده های مختلف مانند CUHK-Occlusion و PennFudanPed استفاده شده است. استراتژی پیشنهادی ترکیبی از شبکه های عصبی کانولوشن RPN مدرن مانند YOLO و شبکه های تقسیم بندی معنایی مانند شبکه هایکاملا۰ کانولوشنی (FCN) است که به طور خاصی با معماری های U-Nets مشابه است. شبیه سازی ها و نتایج پیاده سازی نشان می دهد که روش پیشنهادی می تواند عابر پیاده و افراد را از پایگاه داده های مذکور با دقت قابل قبول و سرعت بالا و عملکرد مناسبی تشخیص دهد.

کلیدواژه ها:

یادگیری عمیق CNN ، کنترل انسداد و جفت شدگی ، شبکه های طرح منطقه (RPN) ، تقسیم بندی معنایی

نویسندگان

حجت رئیسی

رئیس اداره طراحی و توسعه سامانههای هوشمند، معاونت حمل و نقل و ترافیک شهرداری شیراز

سعید رسولی

کارشناس کنترل ترافیک، معاونت حمل و نقل و ترافیک شهرداری شیراز

محمد لهراسبی

کارشناس کنترل ترافیک، معاونت حمل و نقل و ترافیک شهرداری شیراز