shenyi
管理员
管理员
  • UID1
  • 粉丝45
  • 关注0
  • 发帖数838
阅读:346回复:0

【新年休闲公开课】关于OpenAI发布的Sora文生视频几点激情看法

楼主#
更多 发布于:2024-02-17 02:35
 OpenAI最近发布了重磅级产品: Sora
 Sora可以根据你输入的文本,生成最长 60 秒的高清视频,画面稳定度有很大提升、分镜多态可变、多角色切换。
  所以它全称叫做文生模型。一般来说这类模型比较流行的有    循环网络( RNN )、生成对抗网络( GAN )和扩散模型( Diffusion models )。 Sora属于后者,并采用了 Transformer 架构。  
  Sora还基于自家 DALL·E 3(文生图像模型),极大的提高了视频素材训练质量
 文本这块自然利用了 GPT,当我们输入文本时,由GPT来进行文本扩写和联想,再提交给 Sora,使得视频生成更加多样化和贴合用户的需求。


  当然, 今天的视频大家甭指望我能把技术讲清楚(我表示看不懂)。 仅仅是从应用角度和领域角度聊几点,供大家借鉴和思考。
 
   直接看戳这里第156讲:关于OpenAI发布的Sora文生视频几点激情看法
会讲故事的程序员
游客

返回顶部