3D Pooling on Local Space-time Features for Human Action Recognition

  • سال انتشار: 1392
  • محل انتشار: هشتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
  • کد COI اختصاصی: ICMVIP08_146
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 1379
دانلود فایل این مقاله

نویسندگان

Najme Hadibarhaghtalab

School of Computer and Electrical Engineering Shiraz University

Zohreh Azimifar

School of Computer and Electrical Engineering Shiraz University

چکیده

Successful approaches use local space-timefeatures for human action recognition task including handdesigned features or learned features. However these methodsneed a wise technique to encode local features to make a globalrepresentation for video. For this, some methods use K-meansvector quantization to histogram each video as a bag of word.Pooling is a way used for global representation of an image. Thismethod pools the local image feature over some imageneighborhood. In this paper we extend pooling method called 3Dpooling for global representation of video. 3D pooling representseach video by concatenating pooled feature vectors achieved from8 equal regions of video. We also applied stacked convolutionalISA as local feature extractor. We evaluated our method on KTHdata set and got our best result using max pooling. It improvesthe performance of highly demanded earlier methods.

کلیدواژه ها

action recognition; local feature; independent subspace analysis(ISA); pooling

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.