بهبود کارایی در خلاصه سازی ویدیو با استفاده از شبکه هایعصبی

علی کریمی

بهبود کارایی در خلاصه سازی ویدیو با استفاده از شبکه هایعصبی

محل انتشار: پنجمین همایش ملی توسعه علوم فناوریهای نوین در مدیریت، حسابداری و کامپیوتر

سال انتشار: 1401

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 227

فایل این مقاله در 24 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1554064

شناسه ملی سند علمی:

IVCONF05_075

تاریخ نمایه سازی: 26 آبان 1401

چکیده مقاله:

در این تحقیق با توجه به عدم وجود مجموعه داده از صدای گزارشگرمجموعه داده صوتی به زبان انگلیسی شامل بیان ۲۱ کلمه فوتبالیجمع آوری شده است که هر کلمه مجموعا ۲۱۰۰ بار توسط ۷۰۰ نفر متفاوتبیان شده است. شبکه تشخیص کلمه پیشنهادی که شبکه ای مبتنی بر لایه هایکانولوشنی و شبکه های بازگشتی است بر روی این مجموعه داده توانستهاست به دقت ۸۵.۸ درصدی برسد. مجموعه داده جمع آوری شده دیگر شامل۶۲۷۷ ویدیو در ۱۲ رویداد مختلف بوده است که هدف از جمع آوری آنایجاد مجموعه داده ای از رویدادهای مختلف با ابتدا و انتهای مشخصاز آن رویداد بوده است. شبکه عصبی پیشنهادی برای طبقه بندی ویدیوبه طور هم زمان از یادگیری عمیق و یادگیری کم عمق استفاده می کند. ازیادگیری عمیق در راستای استخراج ویژگی های محلی که از ارزش بالاییبرای تشخیص نوع ویدیو برخوردار هستند استفاده می شود و از یادگیریکم عمق در راستای استخراج ویژگی های زمانی استفاده می شود. روشپیشنهادی ۶.۲ درصد دقیق تر از سایر روش های طبقه ویدیو در فوتبال استو درعین حال حدود ۲۹ درصد محاسبات کمتری نسبت به بهترین شبکه عصبیمشابه نیاز دارد. در مجموع با استفاده از شبکه تشخیص صحنه و اعمالشبکه طبقه بندی کننده ویدیو بر روی ویدیو، دقت الگوریتم تشخیص رویداددر طول یک مسابقه فوتبال به ۸۸.۷۳ درصد می رسد. همچنین با اضافه شدنصدای گزارشگر دقت آشکارسازی رویداد ۱.۶۴ درصد و با افزودن صدایتماشاگر دقت ۰.۶۳ درصد افزایش می یابد تا در نهایت دقت آشکارسازیرویداد روش پیشنهادی با استفاده هم زمان از ویدیو، صدای تماشاگر وگزارشگر به ۹۱ درصد برسد.

کلیدواژه ها:

خلاصه سازی ویدیو ، شبکه عصبی ، یادگیری عمیق ، ویدیوفوتبال ، تشخیص رویداد

نویسندگان

علی کریمی

دانشگاه تهرانمهندسی فناوری اطلاعات-گرایش شبکه های ارتباطی و کامپیوتری