افزایش دقت بازشناسی صحنه های طبیعی پویا با استفاده از همبستگی بین نقشه های ویژگی در شبکه های عصبی پیچشی

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 250

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JMVIP-8-2_003

تاریخ نمایه سازی: 19 مرداد 1400

چکیده مقاله:

بازشناسی صحنه­ های پویا یکی از زمینه­ های تحقیقاتی اساسی در حوزه بینایی ماشین بشمار می­ رود. در این مقاله با استفاده از شبکه­ های عصبی پیچشی (CNN)، روشی موثر جهت بازشناسی صحنه­ های پویا ارائه می­ شود. در روش پیشنهادی، همبستگی بین نقشه­ های ویژگی حاصل از لایه­ های مختلف یک شبکه عصبی به عنوان بردار­های ویژگی حاوی اطلاعات ویدئو، مورد استفاده قرار گرفته است. در این روش، ابتدا N فریم از ویدئو انتخاب شده و به کمک یک شبکه عصبی پیچشی، نقشه­ های ویژگی مربوط به فریم­ های منتخب، استخراج شده و برای هر فریم، یک ماتریس گرام محاسبه می­شود که بیانگر ویژگی­ های مکانی فریم­ های ویدئو است. سپس با قطعه­ بندی زمانی فریم­ های منتخب و میانگین­ گیری بر روی ماتریس­ های گرام این فریم­ ها، اطلاعات زمانی نیز لحاظ می­ شود. با انجام عملیات کدینگ ویژگی­ها و سپس pooling، برای هر ویدئو یک بردار ویژگی به منظور طبقه­ بندی ویدئو حاصل می­ شود. نتایج شبیه­ سازی­ ها بر روی سه مجموعه داده مطرح در این زمینه نشان می­دهد که روش پیشنهادی از دقت بازشناسی بهتری در مقایسه با سایر روش­ های مطرح در این زمینه تحقیقاتی برخوردار بوده و دقت بازشناسی را تا ۹% برای مجموعه داده Maryland و ۳% برای مجموعه داده YUP++ بهبود بخشیده است.

کلیدواژه ها:

بازشناسی صحنه های پویا ، شبکه عصبی پیچشی ، همبستگی نقشه های ویژگی

نویسندگان

صفورا حیدری

دانشجوی دکتری مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران

عباس ابراهیمی مقدم

گروه مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران

مرتضی خادمی

گروه مهندسی برق، دانشکده مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران

هادی هادی زاده

گروه مهندسی مخابرات، دانشگاه صنعتی قوچان