【新年休闲公开课】关于OpenAI发布的Sora文生视频几点激情看法

楼主^#

更多发布于：2024-02-17 02:35

OpenAI最近发布了重磅级产品： Sora
Sora可以根据你输入的文本，生成最长 60 秒的高清视频，画面稳定度有很大提升、分镜多态可变、多角色切换。
所以它全称叫做文生模型。一般来说这类模型比较流行的有循环网络（ RNN ）、生成对抗网络（ GAN ）和扩散模型（ Diffusion models ）。 Sora属于后者，并采用了 Transformer 架构。
Sora还基于自家 DALL·E 3（文生图像模型），极大的提高了视频素材训练质量
文本这块自然利用了 GPT，当我们输入文本时，由GPT来进行文本扩写和联想，再提交给 Sora，使得视频生成更加多样化和贴合用户的需求。

当然，今天的视频大家甭指望我能把技术讲清楚（我表示看不懂）。仅仅是从应用角度和领域角度聊几点，供大家借鉴和思考。

直接看戳这里：第156讲:关于OpenAI发布的Sora文生视频几点激情看法

喜欢0

会讲故事的程序员

发帖回复

« 返回列表

您需要登录后才可以回帖，登录或者注册

返回顶部

【新年休闲公开课】关于OpenAI发布的Sora文生视频几点激情看法

最新喜欢：