3D Pooling on Local Space-time Features for Human Action Recognition

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,371

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICMVIP08_146

تاریخ نمایه سازی: 9 بهمن 1392

چکیده مقاله:

Successful approaches use local space-timefeatures for human action recognition task including handdesigned features or learned features. However these methodsneed a wise technique to encode local features to make a globalrepresentation for video. For this, some methods use K-meansvector quantization to histogram each video as a bag of word.Pooling is a way used for global representation of an image. Thismethod pools the local image feature over some imageneighborhood. In this paper we extend pooling method called 3Dpooling for global representation of video. 3D pooling representseach video by concatenating pooled feature vectors achieved from8 equal regions of video. We also applied stacked convolutionalISA as local feature extractor. We evaluated our method on KTHdata set and got our best result using max pooling. It improvesthe performance of highly demanded earlier methods.

نویسندگان

Najme Hadibarhaghtalab

School of Computer and Electrical Engineering Shiraz University

Zohreh Azimifar

School of Computer and Electrical Engineering Shiraz University

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A. A. Amini, H. Zhang, "HMM Based Video Classification Using ...
  • Q. Le, W. Zou, S. Yeung, and A. Ng. "Learing ...
  • A. Hyvarinen, J. Hurri, and P. Hoyer. "Natural Image Statistics, ...
  • M. Marzalek, I. Laptev, and C. Schmid. "Actions in context, ...
  • M. Rodriguez, J. Ahmed, and M. Shah. "Action mach A ...
  • J. Liu, J. Luo, and M. Shah. "Recognizing realistic actions ...
  • A. Klaser, M. Marszalek, and C. Schmid. _ spatio-temporal descriptor ...
  • _ _ and L. _ _ ...
  • _ _ _ _ "Cobolutional leariy ...
  • H. Lee, R. Grosse, R. Ranganath, and A. Ng. "Convolutiont ...
  • H. Wang, M. M. Ullah, A. Klaser, I. Laptev, and ...
  • A. Fathi, G. Mori. "Action recognition by learning mid-level motion ...
  • S. Ji, W. Xu, M. Yang, and K. Yu. "3D ...
  • نمایش کامل مراجع