ترکیب ماشین های بولتزمن محدود دوبعدی و شبکه های LSTM برای شناسایی فعالیت های انسانی در ویدئو: یک رویکرد نوین

  • سال انتشار: 1403
  • محل انتشار: دوفصلنامه محاسبات و سامانه های توزیع شده، دوره: 7، شماره: 1
  • کد COI اختصاصی: JR_IJDCS-7-1_009
  • زبان مقاله: فارسی
  • تعداد مشاهده: 75
دانلود فایل این مقاله

نویسندگان

مجید جودکی

نویسنده مسئول

حسین ابراهیم پور کومله

نویسنده

چکیده

در حوزه تحلیل ویدئو و به ویژه شناسایی فعالیت های انسانی، روش های پیشین علی رغم موفقیت های به دست آمده، در حفظ مستقیم ویژگی های فضایی بدون نیاز به پیش پردازش پیچیده و مدل سازی وابستگی های زمانی طولانی دچار محدودیت هایی بوده اند. در این پژوهش، یک معماری نوین مبتنی بر ترکیب ماشین های بولتزمن محدود دوبعدی و شبکه های LSTM ارائه می شود که با استخراج دقیق الگوهای فضایی از فریم های ویدئویی و مدل سازی موثر روابط زمانی، خلا موجود در ادبیات پژوهشی را برطرف می کند. در روش پیشنهادی،ماشین­های بولتزمن بدون نیاز به پیش پردازش های گسترده، ویژگی های مهم فضایی را از تصاویر استخراج نموده و شبکه­های LSTM وابستگی های زمانی پیچیده را مدل سازی می کنند. نتایج تجربی حاصل از آزمایش بر روی مجموعه داده های KTH، UCF Sports و HMDB۵۱ نشان از بهبود عملکرد با دقت های به ترتیب ۹۵.۳٪، ۹۳.۴٪ و ۷۰.۸٪ دارد که نسبت به روش های رقابتی موجود، کارایی قابل توجهی به اثبات رسانده است.

کلیدواژه ها

یادگیری عمیق، ماشین بولتزمن محدود دو بعدی، شبکه های LSTM، شناسایی فعالیت انسانی، شبکه های عصبی بازگشتی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.