ترکیب ماشین های بولتزمن محدود دوبعدی و شبکه های LSTM برای شناسایی فعالیت های انسانی در ویدئو: یک رویکرد نوین

سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 74

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_IJDCS-7-1_009

تاریخ نمایه سازی: 26 فروردین 1404

چکیده مقاله:

در حوزه تحلیل ویدئو و به ویژه شناسایی فعالیت های انسانی، روش های پیشین علی رغم موفقیت های به دست آمده، در حفظ مستقیم ویژگی های فضایی بدون نیاز به پیش پردازش پیچیده و مدل سازی وابستگی های زمانی طولانی دچار محدودیت هایی بوده اند. در این پژوهش، یک معماری نوین مبتنی بر ترکیب ماشین های بولتزمن محدود دوبعدی و شبکه های LSTM ارائه می شود که با استخراج دقیق الگوهای فضایی از فریم های ویدئویی و مدل سازی موثر روابط زمانی، خلا موجود در ادبیات پژوهشی را برطرف می کند. در روش پیشنهادی،ماشین­های بولتزمن بدون نیاز به پیش پردازش های گسترده، ویژگی های مهم فضایی را از تصاویر استخراج نموده و شبکه­های LSTM وابستگی های زمانی پیچیده را مدل سازی می کنند. نتایج تجربی حاصل از آزمایش بر روی مجموعه داده های KTH، UCF Sports و HMDB۵۱ نشان از بهبود عملکرد با دقت های به ترتیب ۹۵.۳٪، ۹۳.۴٪ و ۷۰.۸٪ دارد که نسبت به روش های رقابتی موجود، کارایی قابل توجهی به اثبات رسانده است.

کلیدواژه ها:

یادگیری عمیق ، ماشین بولتزمن محدود دو بعدی ، شبکه های LSTM ، شناسایی فعالیت انسانی ، شبکه های عصبی بازگشتی

نویسندگان

مجید جودکی

نویسنده مسئول