OpenAI 发布了 Sora 2,这是他们最新的尖端视频和音频生成模型,称其为视频领域的 GPT-3.5 时刻 - 该模型生成的视频最长可达 10 秒(默认 9:16 竖屏),并同步音频,包括困难的物理模拟,模型所犯的错误常常看起来像是 Sora 2 隐式建模的内部代理的错误,而不是物理破坏性错误 - Cameos 让用户录制一次性短视频和音频捕捉,内容是他们阅读验证短语,然后模型可以将他们插入到任何 Sora 生成的环境中,外观和声音都非常准确,只有他们决定谁可以使用他们的 Cameo,并且他们可以随时撤销访问权限或删除任何包含它的视频,包括其他人创建的草稿 - 该应用程序作为一个社交 iOS 平台运作,并未针对时间使用进行优化,而是明确设计为最大化创作而非消费,强烈偏向于来自你关注或互动的人的内容,以及模型认为会激励你自己创作的视频,具有 remix 其他帖子和直接消息分享视频的功能 - 安全措施包括有限的邀请推广,限制上传包含逼真人物的图像,阻止所有视频上传,启动时不支持视频到视频的转换,对未成年人的保护措施更严格,默认滚动限制,C2PA 元数据和所有输出的可见水印,以及评估显示 95.1-99.7% 的有效性来阻止不安全内容 - 初始推广覆盖美国和加拿大,计划扩展,而英国、欧盟和澳大利亚在启动时不包括在内,免费提供,虽然有慷慨的限制,但受计算约束,唯一计划的货币化是如果需求超过计算,则可选支付额外视频,ChatGPT Pro 用户可以访问更高质量的 Sora 2 Pro 模型,API 发布计划在未来