Gemini的Veo 3.1现可通过多张图像生成视频
谷歌Gemini将视频生成推向新高度
随着面向Pro和Ultra订阅用户推出Veo 3.1,谷歌Gemini平台展现了更强的创造力。这一最新更新引入了突破性功能,彻底改变了我们对AI生成视频内容的认知。
数字叙事的构成要素
最突出的功能是什么?全新的"素材转视频"模式就像视觉元素的数字搅拌机。用户现在可以同时上传三张参考图像:
- 角色肖像(如不同角度的自拍)
- 背景场景(例如未来主义城市景观)
- 风格参考(包括著名绘画技法)
系统随后从每张图像中提取关键特征,并将它们合成为精美的8秒全高清分辨率视频。

幕后魔法
早期演示展示了Veo 3.1令人印象深刻的能力。一项测试结合了:
- 多角度自拍
- 赛博朋克城市背景
- 印象派油画风格参考 结果如何?一部名为《印象派未来街头漫步》的无缝短片,其中面部特征始终保持完美一致。
这项技术不仅限于视觉效果。生成的视频还包括:
- 原生环境音效
- 精确控制开头/结尾帧
- 延长现有片段的选项 所有内容都受到谷歌SynthID隐形水印技术的保护。
访问与可用性
对现有订阅用户来说是个好消息——谷歌确认多图像参考功能不会超出当前计划限制额外收费。虽然生成配额保持不变,但创意可能性已呈指数级扩展。
网页和移动界面保持了用户友好的设计,允许通过文本提示一键生成,同时在幕后处理所有复杂的合成工作。
关键点:
- 多图像合成:在一次生成中结合角色、场景和风格参考
- 技术打磨:保持帧与帧之间一致的照明和角色细节
- 创意控制:提供首尾帧编辑和视频延长选项
- 无缝集成:通过现有订阅在网页和移动平台上运行




