AI 前线
InfoQ
AI 前线团队
3818 人已学习
免费领取
课程目录
已更新 54 讲/共 1000 讲
AI 前线
15
15
1.0x
00:00/00:00
登录|注册

GPT-3水平的Sora 就强大到不敢给普通人用?可我也不知道把它用在哪儿

视频生成模型“新王登基”,Sora 何以成为全球焦点?

2023 年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024 年 2 月,OpenAI 旗下视频生成模型 Sora 正式对外发布。Sora 一名源于日文“空”(そら sora),取自天空之意,以示其无限的创造潜力。与 Runway、Pika、VideoPoet 等“前辈”相比,Sora 在视频生成效果和质量上具有明显优势。也正因如此,Sora 一经发布就在全球范围内掀起了讨论热潮,迅速成为当前最受关注的模型之一。
“Sora 的出现时间要比我们预想的要早很多,OpenAI 已经提前带来了惊喜”。WeShop 唯象 GM 吴海波在接受 InfoQ 采访时提到,从技术层面来看,Sora 并没有引入全新的理论框架,而是将现有技术进行了新的整合。自从 Sora 问世以来,人们对其背后的技术进行了深入分析。比如,Meta 的谢赛宁曾在 Twitter 上进行拆解,其认为 Sora 所采用的 DiT 结构,就是基于他在 ICCV 2023 发布的 DiT(Diffusion Transformer)思路构建的,这也是支撑 Sora 的一个重要基础。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

1. Sora 多模态视频生成技术取得显著进展和突破,利用 Transformer 替代 Diffusion 的 U-Net,能够生成更长时间、效果更好的视频。 2. Sora 在影视、电商、游戏行业中带来新的想象力,降低制作成本,提高制作效率,但在电商行业中仍面临一些挑战,需要不断研究并探索新的方法。 3. Sora 技术在游戏行业中的应用,如季节转换、服装道具生成、光影和材料的仿真,以及解决四足动物的动作设计问题,展现出潜在的优势。 4. Sora 的出现引发了对于就业市场的担忧,但专家认为新技术并非完全取代人类,而是帮助提升工作效率,需要积极拥抱变化,寻找新的机遇。 5. AI 技术的快速演变和不断创新的特性超乎了所有人的预期,需要保持对 AI 技术发展的关注,随时准备迎接新的突破和变化,参与到 AI 变革中来。

该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

全部留言(1)

  • 最新
  • 精选
  • Geek_22c32b
    回收旧手机就是就是手机就是
    2024-05-11归属地:河北
收起评论
显示
设置
留言
1
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部