阅读:1133回复:0
【新年休闲公开课】关于OpenAI发布的Sora文生视频几点激情看法
OpenAI最近发布了重磅级产品: Sora
Sora可以根据你输入的文本,生成最长 60 秒的高清视频,画面稳定度有很大提升、分镜多态可变、多角色切换。 所以它全称叫做文生模型。一般来说这类模型比较流行的有 循环网络( RNN )、生成对抗网络( GAN )和扩散模型( Diffusion models )。 Sora属于后者,并采用了 Transformer 架构。 Sora还基于自家 DALL·E 3(文生图像模型),极大的提高了视频素材训练质量 文本这块自然利用了 GPT,当我们输入文本时,由GPT来进行文本扩写和联想,再提交给 Sora,使得视频生成更加多样化和贴合用户的需求。 当然, 今天的视频大家甭指望我能把技术讲清楚(我表示看不懂)。 仅仅是从应用角度和领域角度聊几点,供大家借鉴和思考。 直接看戳这里: 第156讲:关于OpenAI发布的Sora文生视频几点激情看法 |
|
|