人人都能是配音导演,阶跃星辰发布语音生成模型 StepAudio 2.5 TTS

浏览25次 点赞0次 收藏0次

4 月 16 日消息,阶跃星辰今日发布新一代语音生成模型 StepAudio 2.5 TTS,官方号称人人都能是配音导演。

阶跃星辰官方表示,该语音合成模型首次将语境理解能力引入语音生成全流程。通过 Global Context(全局语境)+ Inline Context(文中语境)双档控制,搭配 Zero-shot 音色复刻,让 AI 不是念文本,而是演文本

StepAudio 2.5 TTS 支持以下核心能力:

  • 全局语境控制:支持自定义整段语音的情绪基调、角色状态与场景氛围,使表达更统一、更连贯。

  • 文中语境控制:不仅能控制一句话怎么说,还能进一步调节语气、节奏、停顿、轻重变化、角色感和场景感,让声音表达更有分寸。

  • 零样本复刻与全音色控制:在保留目标音色特征的同时,支持对情感、风格和表达方式进行灵活调节,让同一种声音说出更多不同感觉。

附官方演示网址如下:

https://stepaudiollm.github.io/step-audio-2.5-tts/zh.html

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。