قطعه بندی زمانی ویدیوها بر اساس اعمال مختلف انسان به کمک مدل پنهان مارکوف

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 317

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ELCM02_120

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

تحلیل ویدیوها و تشخیص اعمالی که در یک ویدیو درحال انجام است، یکی از چالش های پرکاربرد در مقوله ی بینایی ماشین می باشد که در سیستم های مختلف نظیر نظارت بر رفتارهای مشکوک فرودگاه ها یا موزه ها، ربات های در تعامل با انسان و غیره استفاده می شود. در این مسیله با یک ویدیو که حاوی یک یا چند عمل می باشد، سروکار داریم. روش های نوین تشخیص عمل عمدتا بر اساس شناسایی نقاط موثر در ابعاد مکانی و زمانی می باشند به این صورت که به جای آن که تمامی پیکسل های تصاویر یک ویدیو مورد بررسی قرار گیرد، با بررسی الگوهای این نقاط که به وسیله ی توصیف گرهایی نظیر کیسه ی لغات تصویری یا بردار فیشر توصیف می شوند، به تصمیم گیری در مورد نوع عمل می پردازند. جهت تشخیص اعمال مختلف در ویدیوهای طولانیتر می توان از یک راهکار عمومی استفاده کرد به این صورت که ابتدا قطعه بندی در بعد زمان انجام دهیم به این صورت که در هر کلیپ (قطعه) مطمین باشیم تنها یک عمل درحال انجام می باشد. سپس مراحل لازم را جهت تشخیص برروی آن اعمال می شود. اما سوال اینجاست که چگونه می توان بدون تشخیص عمل، فریم های مرزی را برای هر عمل شناسایی کرد. دراین مقاله یک روش ابتکاری معرفی می گردد که درآن طراحی خاصی از مدل پنهان مارکوف معرفی گردیده و به کمک آن می توان به تشخیص فریم های مرزی کلیپ از روی ویدیوهای طولانی پرداخت.

نویسندگان

مصطفی رستگار

کارشناس ارشد هوش مصنوعی، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران

احمدعلی آبین

استادیار، هوش مصنوعی، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران