تکامل مدل های Transformer تا مدل های مولد ویدئو Sora
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 60
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ECME26_082
تاریخ نمایه سازی: 25 خرداد 1404
چکیده مقاله:
این مقاله به بررسی مدل Sora، یکی از پیشرفته ترین مدل های مولد ویدئو، می پردازد. ابتدا پیش زمینه ای از مدل های Transformer و معماری آن ها ارائه می شود، سپس مسیر تکاملی این مدل ها از پردازش زبان طبیعی تا بینایی کامپیوتر و در نهایت تولید ویدئو مورد بررسی قرار می گیرد. مدل Sora به عنوان یک نقطه عطف در این مسیر تکاملی، با جزئیات فنی، قابلیت ها و محدودیت های آن معرفی می شود. این مقاله همچنین به تاثیرات و کاربردهای بالقوه این فناوری در صنعت و جامعه می پردازد.
نویسندگان
سبحان رضایی
۱دانشجوی کامیپوتر دانشگاه ملی مهارت تهران ایران
مهرداد حمیدزاده
۲ دکترای مدیریت فناوری اطلاعات , گروه کامپیوتر , دانشگاه ملی مهارت تهران ایران
امین کیانی
۳دانشجوی دکترای رایانش امن , گروه کامپیوتر , دانشگاه ملی مهارت تهران ایران