普通话响应速度提升 3 倍，ElevenLabs 发布文本转语音 Turbo 2.5 AI 模型

2024-07-22 发布浏览599次点赞0次收藏0次

7 月 20 日消息，ElevenLabs 昨日（7 月 19 日）发布博文，介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型，支持普通话等 32 种语言，为全球近 80% 的地区提供高质量、低延迟的 AI 对话。

Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语，这些语言的使用人数分别为 8500 万、1300 万和 530 万。

本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度，最高提升了 3 倍；英语的速度提高了 25%。附上宣传视频如下：

Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构，用户基本上不需要等待，就能提供高质量的 AI 生成音频输出。

Turbo 模型实现了快速语音合成，同时保持流畅和自然的高品质音质，响应时间不超过 400 毫秒。

ElevenLabs 成立于 2022 年，总部位于伦敦，专注于开发人工智能语音模型和工具，可以创建不同语言、口音和情感的合成语音。

公司首席执行官 Mati Staniszewski 表示，ElevenLabs 目前拥有约 40 名远程办公员工，分布在全球各地，并计划到年底将团队扩大至 100 人。

ElevenLabs 非常重视人工智能内容的透明度，并开发了 AI Speech Classifier 等工具帮助识别合成音频，同时也在开发用于电影配音的工具，并正在开发一个允许用户生成 AI 语音并通过授权赚钱的平台。

人工智能 AI

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！