谷歌Veo 3逆天升级，照片秒变活人开口讲话！广告动漫圈一夜沦陷

2025-07-09 发布浏览378次点赞0次收藏0次

【导读】图片也能开口说话了！昨晚，谷歌Veo 3全新升级，上传一张照片即可生成音频和视频，角色一致性更是达到新高度。

刚刚，AI视频顶流Veo 3重磅升级。

这一次，只需一张图即生成音频+视频大片，进入谷歌Flow创作平台即可体验。

同一个角色，能在多个镜头下，保持高度一致性。就连星际迷航类型的科幻片，Veo 3可以一键复刻出来。

还有网友直接用Veo 3拍了一部「巨魔之死」的预告短片，音效、人物一致性极其震撼。

Veo 3如此炸裂的效果，如何体验？

图片张口说话了

在进行实测后，感叹Veo3的视频生成表现力真的令人惊艳。

钢铁侠竟然可以开口说话了！看了让人头皮发麻。

本次使用的图片如下，提示词为「let him talk something」。

生成效果非常惊艳！Veo3生成了两个版本的视频。

第一个比较「正经」，是类似变形金刚中擎天柱的风格。

第二个就比较「符合」钢铁侠本人的风格。

整体来看，这两个视频和初始图片的一致性非常之高，画面运镜也没有任何不和谐之处。

本次更新需要在Flow平台下进行，选择「Frames to Video」的选项，就能从一张图片开始生成视频。

需要注意的是，在Gemini Veo3入口目前还无法使用该项功能。

可以选择首帧，并进行调换来设置想要生成视频的内容。

这里也需要注意，同时选择首帧和尾帧，是无法使用Veo3的，只能使用Veo2。

值得一提的是，此次更新，加入非常丰富的运镜功能，比如Dolly in推镜头，指的就是摄像机沿轨道向前移动。

这是以上所有运镜功能的总结，给大家参考。

同时，也用奥特曼做了测试，这次我们只给了图片，没有给出任何文本提示，Veo3依然进行完美的配乐和动画创造。

最后，你可以通过选择更好的Quality模型，生成质量更高的视频，但要消耗更多的credits。

Quality消耗的是Fast的5倍，Fast消耗20credits，Quality是100credits。

关于此次更新更多改进，可以查看谷歌官方的更新文档。

网友实测

Veo 3更新后，网友第一时间开启了测试。

有人表示，图像带音频的视频生成，堪称是AI叙事领域的一大突破，尤其是前后一致的角色。

包括人物角色的表情非常自然，表演也很到位。

还有前段时间，比较火爆的第一视角AI视频生成，Veo 3基于图像的生成同样令人惊艳。

再看这位老人，带着巨大的笑容说着，「谷歌刚刚更新了Veo 3，而且Veo 3在Flow上速度很快，但他们还没把它带到Gemini应用里」。

提示词：
{
  "shot": {
    "composition": "Medium close-up, 85mm lens, shot on ARRI Alexa Mini LF, shallow depth of field, static camera",
    "camera_motion": "locked off",
    "frame_rate": "24fps",
    "film_grain": "light Kodak 250D grain overlay"
  },
  "subject": {
    "description": "An elderly woman with exaggerated, cartoonish features: enormous toothy grin stretching nearly ear to ear, deep crow’s feet around wide, manic eyes, a long thin neck with pronounced tendons, and wild silver hair pulled back in a loose bun with stray wisps. She wears a bright blue floral blouse with pink hibiscus flowers and small silver hoop earrings.",
    "wardrobe": "bright blue floral blouse with pink hibiscus print, silver hoop earrings"
  },
  "scene": {
    "location": "studio backdrop",
    "time_of_day": "indeterminate, evenly lit",
    "environment": "smooth gradient background in lavender to mauve tones, minimal distractions"
  },
  "visual_details": {
    "action": "the woman leans slightly forward toward camera, her enormous grin widening unnaturally, eyes bulging with gleeful intensity as she clasps her bony hands together just below her chin",
    "props": "none"
  },
  "cinematography": {
    "lighting": "soft key light slightly overhead, gentle fill to reduce shadows, creating an uncanny hyperreal clarity on her wrinkles and teeth",
    "tone": "darkly comedic, unsettling"
  },
  "audio": {
    "ambient": "faint hum of studio lights",
    "voice": "old, raspy, whispery with a gleeful, creepy lilt"
  },
  "color_palette": "muted pastels with pops of saturated pink and blue, creating an eerie contrast",
  "dialogue": {
    "character": "Elderly Woman",
    "line": "Google just updated Veo3… and Veo3 fast on Flow… but they didn’t bring it yet to the Gemini app… (giggles, then erupts into a raspy, unhinged laugh)",
    "subtitles": false
  }
}

还有网友上传一张Midjourney生成的图片，再交由Veo 3配音+视频画面，瞬间定制一款独特的香奈儿广告。

就连动画领域，Veo 3也没有放过。

参考资料：

https://x.com/venturetwins/status/1942371183644794987

https://x.com/Diesol/status/1942452185259991246

https://x.com/TawohAwa/status/1942547376121725096

https://www.youtube.com/watch?v=-xthML25JOs

Google 谷歌体验测试 Go AI

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

谷歌Veo 3逆天升级，照片秒变活人开口讲话！广告动漫圈一夜沦陷

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。