تکامل مدل های Transformer تا مدل های مولد ویدئو Sora

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 60

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECME26_082

تاریخ نمایه سازی: 25 خرداد 1404

چکیده مقاله:

این مقاله به بررسی مدل Sora، یکی از پیشرفته ترین مدل های مولد ویدئو، می پردازد. ابتدا پیش زمینه ای از مدل های Transformer و معماری آن ها ارائه می شود، سپس مسیر تکاملی این مدل ها از پردازش زبان طبیعی تا بینایی کامپیوتر و در نهایت تولید ویدئو مورد بررسی قرار می گیرد. مدل Sora به عنوان یک نقطه عطف در این مسیر تکاملی، با جزئیات فنی، قابلیت ها و محدودیت های آن معرفی می شود. این مقاله همچنین به تاثیرات و کاربردهای بالقوه این فناوری در صنعت و جامعه می پردازد.

نویسندگان

سبحان رضایی

۱دانشجوی کامیپوتر دانشگاه ملی مهارت تهران ایران

مهرداد حمیدزاده

۲ دکترای مدیریت فناوری اطلاعات , گروه کامپیوتر , دانشگاه ملی مهارت تهران ایران

امین کیانی

۳دانشجوی دکترای رایانش امن , گروه کامپیوتر , دانشگاه ملی مهارت تهران ایران