谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷

2025-07-09 发布 · 浏览37次 · 点赞0次 · 收藏0次

【导读】图片也能开口说话了!昨晚,谷歌Veo 3全新升级,上传一张照片即可生成音频和视频,角色一致性更是达到新高度。

刚刚,AI视频顶流Veo 3重磅升级。

这一次,只需一张图即生成音频+视频大片,进入谷歌Flow创作平台即可体验。

同一个角色,能在多个镜头下,保持高度一致性。就连星际迷航类型的科幻片,Veo 3可以一键复刻出来。

还有网友直接用Veo 3拍了一部「巨魔之死」的预告短片,音效、人物一致性极其震撼。

Veo 3如此炸裂的效果,如何体验?

图片张口说话了

在进行实测后,感叹Veo3的视频生成表现力真的令人惊艳。

钢铁侠竟然可以开口说话了!看了让人头皮发麻。

本次使用的图片如下,提示词为「let him talk something」

生成效果非常惊艳!Veo3生成了两个版本的视频。

第一个比较「正经」,是类似变形金刚中擎天柱的风格。

第二个就比较「符合」钢铁侠本人的风格。

整体来看,这两个视频和初始图片的一致性非常之高,画面运镜也没有任何不和谐之处。

本次更新需要在Flow平台下进行,选择「Frames to Video」的选项,就能从一张图片开始生成视频。

需要注意的是,在Gemini Veo3入口目前还无法使用该项功能。

可以选择首帧,并进行调换来设置想要生成视频的内容。

这里也需要注意,同时选择首帧和尾帧,是无法使用Veo3的,只能使用Veo2。

值得一提的是,此次更新,加入非常丰富的运镜功能,比如Dolly in推镜头,指的就是摄像机沿轨道向前移动。

这是以上所有运镜功能的总结,给大家参考。

同时,也用奥特曼做了测试,这次我们只给了图片,没有给出任何文本提示,Veo3依然进行完美的配乐和动画创造。

最后,你可以通过选择更好的Quality模型,生成质量更高的视频,但要消耗更多的credits。

Quality消耗的是Fast的5倍,Fast消耗20credits,Quality是100credits。

关于此次更新更多改进,可以查看谷歌官方的更新文档。

网友实测

Veo 3更新后,网友第一时间开启了测试。

有人表示,图像带音频的视频生成,堪称是AI叙事领域的一大突破,尤其是前后一致的角色

包括人物角色的表情非常自然,表演也很到位。

还有前段时间,比较火爆的第一视角AI视频生成,Veo 3基于图像的生成同样令人惊艳。

再看这位老人,带着巨大的笑容说着,「谷歌刚刚更新了Veo 3,而且Veo 3在Flow上速度很快,但他们还没把它带到Gemini应用里」。

提示词:
{
  "shot": {
    "composition": "Medium close-up, 85mm lens, shot on ARRI Alexa Mini LF, shallow depth of field, static camera",
    "camera_motion": "locked off",
    "frame_rate": "24fps",
    "film_grain": "light Kodak 250D grain overlay"
  },
  "subject": {
    "description": "An elderly woman with exaggerated, cartoonish features: enormous toothy grin stretching nearly ear to ear, deep crow’s feet around wide, manic eyes, a long thin neck with pronounced tendons, and wild silver hair pulled back in a loose bun with stray wisps. She wears a bright blue floral blouse with pink hibiscus flowers and small silver hoop earrings.",
    "wardrobe": "bright blue floral blouse with pink hibiscus print, silver hoop earrings"
  },
  "scene": {
    "location": "studio backdrop",
    "time_of_day": "indeterminate, evenly lit",
    "environment": "smooth gradient background in lavender to mauve tones, minimal distractions"
  },
  "visual_details": {
    "action": "the woman leans slightly forward toward camera, her enormous grin widening unnaturally, eyes bulging with gleeful intensity as she clasps her bony hands together just below her chin",
    "props": "none"
  },
  "cinematography": {
    "lighting": "soft key light slightly overhead, gentle fill to reduce shadows, creating an uncanny hyperreal clarity on her wrinkles and teeth",
    "tone": "darkly comedic, unsettling"
  },
  "audio": {
    "ambient": "faint hum of studio lights",
    "voice": "old, raspy, whispery with a gleeful, creepy lilt"
  },
  "color_palette": "muted pastels with pops of saturated pink and blue, creating an eerie contrast",
  "dialogue": {
    "character": "Elderly Woman",
    "line": "Google just updated Veo3… and Veo3 fast on Flow… but they didn’t bring it yet to the Gemini app… (giggles, then erupts into a raspy, unhinged laugh)",
    "subtitles": false
  }
}  

还有网友上传一张Midjourney生成的图片,再交由Veo 3配音+视频画面,瞬间定制一款独特的香奈儿广告。

就连动画领域,Veo 3也没有放过。

参考资料:

https://x.com/venturetwins/status/1942371183644794987

https://x.com/Diesol/status/1942452185259991246

https://x.com/TawohAwa/status/1942547376121725096

https://www.youtube.com/watch?v=-xthML25JOs

谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。