ترکیب ماشین های بولتزمن محدود دوبعدی و شبکه های LSTM برای شناسایی فعالیت های انسانی در ویدئو: یک رویکرد نوین
سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 74
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_IJDCS-7-1_009
تاریخ نمایه سازی: 26 فروردین 1404
چکیده مقاله:
در حوزه تحلیل ویدئو و به ویژه شناسایی فعالیت های انسانی، روش های پیشین علی رغم موفقیت های به دست آمده، در حفظ مستقیم ویژگی های فضایی بدون نیاز به پیش پردازش پیچیده و مدل سازی وابستگی های زمانی طولانی دچار محدودیت هایی بوده اند. در این پژوهش، یک معماری نوین مبتنی بر ترکیب ماشین های بولتزمن محدود دوبعدی و شبکه های LSTM ارائه می شود که با استخراج دقیق الگوهای فضایی از فریم های ویدئویی و مدل سازی موثر روابط زمانی، خلا موجود در ادبیات پژوهشی را برطرف می کند. در روش پیشنهادی،ماشینهای بولتزمن بدون نیاز به پیش پردازش های گسترده، ویژگی های مهم فضایی را از تصاویر استخراج نموده و شبکههای LSTM وابستگی های زمانی پیچیده را مدل سازی می کنند. نتایج تجربی حاصل از آزمایش بر روی مجموعه داده های KTH، UCF Sports و HMDB۵۱ نشان از بهبود عملکرد با دقت های به ترتیب ۹۵.۳٪، ۹۳.۴٪ و ۷۰.۸٪ دارد که نسبت به روش های رقابتی موجود، کارایی قابل توجهی به اثبات رسانده است.
کلیدواژه ها:
یادگیری عمیق ، ماشین بولتزمن محدود دو بعدی ، شبکه های LSTM ، شناسایی فعالیت انسانی ، شبکه های عصبی بازگشتی
نویسندگان
مجید جودکی
نویسنده مسئول
حسین ابراهیم پور کومله
نویسنده