استفاده از یادگیری عمیق بازنمایشها برای بازشناسی کنشهای انسانی در ویدیو
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 570
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IRANOPEN07_009
تاریخ نمایه سازی: 29 فروردین 1397
چکیده مقاله:
در این مقاله برای یادگیری ویژگی های مکانی-زمانی و به منظور بازشناسی کنش های انسانی از روی توالی های ویدیویی، یک مدل سلسله مراتبی و عمیق بدون ناظر پیشنهاد شده است. در بلوک سازنده این مدل سلسله مراتبی، دو معیار تنک بودن و کند بودن، به عنوان تنظیم کننده در یک تابع هدف با یکدیگر ترکیب شده اند. سپس برای یادگیری ویژگی های سطح بالا، این بلوک سازنده را با تکنیک های یادگیری عمیق، کانولوشن و پشته ای قرار دادن لایه ها ترکیب کرده ایم. بکارگیری این مدل برای استخراج ویژگی های مکانی-زمانی منجر به دقت 94/5 ٪ بر روی پایگاه داده KTH و میانگین متوسط صحت، 54/8 ٪ بر روی پایگاه داده Hollywood2 شده است که بهبود کارایی آن نسبت به معیار تنک بودن، به ترتیب 3٪ و 1/5 ٪ و نسبت به معیار کند بودن، به ترتیب حدود 1/3 ٪ و 6٪ است.
کلیدواژه ها:
نویسندگان
رضا صفدری
دانشگاه آزاد اسلامی، واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، قزوین، ایران
محمدشهرام معین
پژوهشگاه ارتباطات و فناوری اطلاعات، پژوهشکده فناوری اطلاعات، تهران، ایران