AI 中文社/资讯/详情

返回

Character.AI 突破性技术：实时 AI 角色视频互动

2025-07-05 发布 · 浏览212次 · 点赞0次 · 收藏0次

7 月 5 日消息，AI 聊天机器人平台 Character.AI 发布研究论文和视频演示，展示了名为 TalkingMachines 的自回归扩散模型，让 AI 角色互动更加逼真。

该模型尚未部署在 Character.AI 平台上，根据研究论文和视频演示，用户只需要输入一张图片和声音信号，该模型就能实现类似 FaceTime 的通话视觉互动。

该模型基于 Diffusion Transformer（DiT）技术，本质上是一种能够从随机噪声中创建详细图像的“艺术家”，并不断优化图像直至完美。Character.AI 所做的就是让这一过程变得极其迅速，达到实时效果。

Character.AI 突破性技术：实时 AI 角色视频互动

TalkingMachines 模型采用了流匹配扩散（Flow-Matched Diffusion）、音频驱动的交叉注意力（Audio-Driven Cross Attention）、稀疏因果注意力（Sparse Causal Attention）和不对称蒸馏（Asymmetric Distillation）等多种关键技术。

Character.AI 突破性技术：实时 AI 角色视频互动

其中流匹配扩散技术通过训练大量动作，包括细微的面部表情和更夸张的手势，确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词，还能理解音频中的节奏、停顿和语调，并将其转化为精确的口型、点头和眨眼。

稀疏因果注意力技术让 Character.AI 能够以更高效的方式处理视频帧，而不对称蒸馏技术则让视频能够实时生成，营造出类似 FaceTime 通话的效果。

Character.AI 突破性技术：实时 AI 角色视频互动

Character.AI 强调，这一研究突破不仅仅是关于面部动画的，它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。

附上参考地址

AI Character

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。

浏览(212) 点赞(0) 收藏(0)

0条评论

珍惜第一个评论，它能得到比较好的回应。

评论

游客

登录后再评论

鸟过留鸣，人过留评。
和谐社区，和谐点评。

关于我们/ 免责声明/ 问与答/ 积分奖励消耗规则/ 联系我们/ Markdown 教程

Copyright © 2022-2025 aizws.net · 网站版本: v1.2.6·内部版本: v1.25.1· 页面加载耗时 0.00 毫秒·物理内存 110.3MB ·虚拟内存 1307.1MB

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。为了更好的体验，本站推荐使用 Chrome 浏览器。