VG-CGARN: Video Generation Using Convolutional Generative Adversarial and Recurrent Networks
محل انتشار: فصلنامه بین المللی وب پژوهی، دوره: 8، شماره: 2
سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 82
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_IJWR-8-2_005
تاریخ نمایه سازی: 16 خرداد 1404
چکیده مقاله:
Generating dynamic videos from static images and accurately modeling object motion within scenes are fundamental challenges in computer vision, with broad applications in video enhancement, photo animation, and visual scene understanding. This paper proposes a novel hybrid framework that combines convolutional neural networks (CNNs), recurrent neural networks (RNNs) with long short-term memory (LSTM) units, and generative adversarial networks (GANs) to synthesize temporally consistent and spatially realistic video sequences from still images. The architecture incorporates splicing techniques, the Lucas-Kanade motion estimation algorithm, and a loop feedback mechanism to address key limitations of existing approaches, including motion instability, temporal noise, and degraded video quality over time. CNNs extract spatial features, LSTMs model temporal dynamics, and GANs enhance visual realism through adversarial training. Experimental results on the KTH dataset, comprising ۶۰۰ videos of fundamental human actions, demonstrate that the proposed method achieves substantial improvements over baseline models, reaching a peak PSNR of ۳۵.۸ and SSIM of ۰.۹۶—representing a ۲۰% performance gain. The model successfully generates high-quality, ۱۰-second videos at a resolution of ۷۲۰×۱۲۸۰ pixels with significantly reduced noise, confirming the effectiveness of the integrated splicing and feedback strategy for stable and coherent video generation.
کلیدواژه ها:
نویسندگان
Fatemeh Sobhani Manesh
MSc, Computer Engineering Department, Bu-Ali Sina University, Hamedan, Iran
Amin Nazari
Ph.D. Candidate, Computer Engineering Department, Bu-Ali Sina University, Hamedan, Iran
Muharram Mansoorizadeh
Associate Professor, Computer Engineering Department, Bu-Ali Sina University, Hamedan, Iran
MirHossein Dezfoulian
Assistant Professor, Computer Engineering Department, Bu-Ali Sina University, Hamedan, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :