通信世界网消息(CWW)12月17日消息,谷歌今日发布最新版本的视频生成模型Veo 2,与OpenAI的Sora展开正面竞争。谷歌表示,Veo 2可以生成更为逼真的视频内容。
与此同时,谷歌还对其图像生成模型Imagen进行了升级,推出了Imagen 3,旨在生成内容更为丰富、细节更为精致的图片。
谷歌指出,Veo 2“对现实世界的物理规律以及人类动作和表情的微妙之处有了更深入的理解”。目前,该模型可在谷歌实验室的VideoFX平台上试用,但用户需通过谷歌表格注册,加入等候名单,并等待谷歌在指定时间内临时开放访问。
谷歌在一篇博客文章中提到:“Veo 2同样精通电影制作手法:只需指定一个类型、镜头以及一些电影特效建议,Veo 2即可生成最高可达4K分辨率的视频。”
尽管Veo 2目前仅对部分受邀用户开放,但原始版本的Veo仍可在Vertex AI平台上使用。通过Veo 2生成的视频将嵌入谷歌特有的元数据水印SynthID,以此标识这些视频为人工智能生成内容。
谷歌也承认,Veo 2可能仍会偶尔出现如多余手指等“幻觉”,但公司承诺新版本将大幅减少此类现象。
Veo 2将与OpenAI近期推出的Sora视频生成模型直接竞争,争夺电影制作人及内容创作者的市场。值得一提的是,Sora在全面开放给付费用户之前,已进行了预览测试。
在谷歌的内部测试中,Veo在“总体偏好”(即观众更喜欢哪些视频)和“提示依从性”(视频与人类创作者指令的匹配度)两项指标上均超越了Sora及其他竞争对手的AI模型,这一表现尤为亮眼。