美团开源虚拟人视频生成模型 LongCat-Video-Avatar：号称“不说话”时都像人

2025-12-18 发布 · 浏览205次 · 点赞0次 · 收藏0次

感谢网友啊俊、Diixx 的线索投递！

12 月 18 日消息，据“龙猫 LongCat”公众号今晚的推文，美团 LongCat 团队正式发布并开源 SOTA 级虚拟人视频生成模型 ——LongCat-Video-Avatar。

该模型基于 LongCat-Video 基座打造，延续“一个模型支持多任务”的核心设计，原生支持 Audio-Text-to-Video、Audio-Text-Image-to-Video 及视频续写等核心功能，同时在底层架构上全面升级，实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。

据官方介绍，该模型具备如下技术亮点。

“告别僵硬，迎接鲜活”：不仅能指挥嘴型，还能同步指挥眼神、表情和肢体动作，实现丰富饱满的情感表达。

连“不说话”的时候，都很像人：美团通过 Disentangled Unconditional Guidance（解耦无条件引导）训练方法，让模型明白了“静音”不等于“死机”。在说话的间歇，虚拟人也会如同人类一般自然地眨眼、调整坐姿、放松肩膀。

据介绍，LongCat-Video-Avatar 因此成为首个同时支持文字、图片、视频三种生成模式的“全能选手”，虚拟人从此有了“真正的生命力”。

在 HDTF、CelebV-HQ 、EMTD 和 EvalTalker 等权威公开数据集上的定量评测表明，LongCat-Video-Avatar 在多项核心指标上达到 SOTA 领先水平。

附项目地址：

人工智能 4 美团数字人虚拟人

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。

浏览(205) 点赞(0) 收藏(0)

0条评论

珍惜第一个评论，它能得到比较好的回应。

游客

登录后再评论

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程 / 今日访问113人，当前在线1人，最高同时在线163人

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。