شبکه تجمیع عصبی بازسازی کننده تشخیص چهره در ویدئو

  • سال انتشار: 1401
  • محل انتشار: بیست و هشتمین کنفرانس بین المللی کامپیوتر انجمن کامپیوتر ایران
  • کد COI اختصاصی: CSICC28_008
  • زبان مقاله: فارسی
  • تعداد مشاهده: 181
دانلود فایل این مقاله

نویسندگان

زهرا طالبی

دانشجو کارشناسی ارشد، مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیک، دانشگاه صنعتی امیرکبیر، تهران

احمد نیک آبادی

استادیار، هوش مصنوعی و رباتیک، دانشگاه صنعتی امیرکبیر، تهران

چکیده

در این مقاله به ارائه شبکه تجمیع عصبی بازسازی کننده RNAN :Regenerative Neural Aggregation Network پرداخته می شود. این شبکه دنباله ای با تعداد متغییر از فریم های چهره در ویدئو را به عنوان ورودی دریافت کرده و بعد از ترمیم و بازسازی فریم ها یک بازنمایی فشرده با ابعاد ثابت از ویژگی فریم ها را تولید می کند. شبکه RNAN پیشنهادی دارای سه بخش اصی است. بخش اول شبکه، فریم ها را دریافت می کند و با استفاده از شبکه مولد تقابلی به بازسازی چهره یا ترمیم کیفیت فریم های با کیفیت پایین می پردازد. بخش دوم شبکه، یک شبکه باقیمانده ای ResNet است که برای استخراج ویژگی از فریم ها استفاده می شود. در نهایت بخش سوم، تعدادی ویژگی استخراج شده از فریم ها را دریافت کرده و یک بردار واحد تجمیع شده را به عنوان خروجی تولید می کند. این خروجی در تایید هویت و بازشناسی چهره در ویدئو استفاده می شود. کارایی دو بخش انتهایی شبکه بر روی مجموعه داده A-IJB مقایسه شده و نتایج نهایی بر روی مجموعه داده ارائه شده Dataset-TV بیان می شود. نتایج نشان می دهند که شبکه RNAN به صورت قابل مشاهده ای نسبت به شبکه های تجمیع ساده بهتر عمل می کند

کلیدواژه ها

تشخیص چهره در ویدئو، شبکه تجمیع عصبی، شبکه ترمیمی، شبکه بازسازی کننده، شبکه مولد تقابلی، مکانیزم توجه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.