
呱呱有声-制作平台
长音频内容生产AIGC开放平台

Uberduck
Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。

Krisp
Krisp是一款人工智能降噪工具,适用于Mac和Windows。它可以消除通话中的背景声音、噪音和回声,让用户安心。它还在每次通话结束时提供有用的见解,包括通话时间、会议见解和通话摘要。Krisp受到全球品牌的信任,并提供安全加密的连接,SOC-2,谷歌OAuth和SAML。

TTSMaker马克配音
免费的AI配音平台,可以将文本转换成语音,支持50多种语言和300多种语音风格

好未来AI开放平台
提供领先的AI能力与解决方案,助力教育智能化发展

podcast.ai
在 Play.ht,我们相信未来所有的内容创作都将由 AI 生成,但由人类指导,而最具创造性的工作将取决于人类将他们想要的创作表达给机器的能力。

Dolly AI
Fork your voice in a flash

MURF.AI
在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

字幕说
在线语音合成、字幕及视频生成工具,制作视频无需出镜

Convai Technologies Inc.
Convai Technologies Inc.为...

腾讯AI实验室
共同打造产学研用一体的 AI 生态

滴滴人工智能实验室
全球智能交通的前沿科技实验室

知存科技
专注研发基于存算一体先进技术的人工智能芯片

肇观电子
让残障人士在内的每个人都生活的更好

寒武纪
打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片

讯飞智聘
企业招聘全流程的智能化解决方案

Sonix
一个自动转录、翻译和字幕平台,快速、准确、实惠。它可以将音频和视频转换为文本,利用其先进的自动翻译引擎在几分钟内翻译文本,并创建全自动字幕

DeepL-translator
DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务,可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

阿里翻译
全球214种语言,深耕多个垂直领域

voice.ai
我们正在构建语音技术的未来

Sonantic.io
Sonantic Limited是一个利用人工智能,通过其API及网络应用程序进行内容创作、分析、编辑及分发的文字转语音工具。

voicemod
使用我们的实时AI 变声器和音板表达自己,随时随地在元宇宙中成为您想要的人。为Roblox、OBS、VRChat、Discord等平台打造您的声音身份。

ReadSpeaker
ReadSpeaker 提供了一系列强大的文本转语音解决方案,可在任何环境中即时部署逼真、定制的语音交互。

Dubverse.ai
只需单击一个按钮,即可使您的内容支持多种语言,并覆盖更多人。

Audo AI
Audo AI为创作者和开发人员提供噪声消除产品,包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展,自动去除背景噪音,增强音频录制,在任何环境下为用户提供清晰易懂的语音。

Altered Studio Voice Editor
Altered Studio Voice Editor允许用户通过将他们的声音更改为任何精心策划的组合声音或自定义声音来创建专业的声音表演。它还允许用户创建引人入胜的多角色表演和克隆他们的声音。该工具还直接在浏览器中为用户提供音频编辑功能,并提供最大的安全性。

MetaVoice Studio
MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。

SO-VITS-SVC4.0
SO-VITS-SVC4.0详细安装、训练、推理使用步骤

iMyFone MagicMic
iMyFone Filme provides multiple voice editing tools to turn your powerful moment

TTS-vue
搬运请注明出处。

TTS Online
提供200多种声音选择,并支持多款热门游戏角色语音生成

云蝠智能
优秀的AI对话能力OEM集成商

捷通华声—人工智能技术与服务提供商
“灵云科技 源自清华 服务全球”的发展战略

LipDub
用人工智能在几秒钟内说任何语言

Relayed
Relayed是一款人工智能驱动的视频会议工具,旨在帮助团队克服远程工作、繁忙的日程安排和会议疲劳。它具有灵活的视频会议,异步对话,自动摘要,通过秘密链接和限制访问轻松共享,以及统一通信,并能够在以后重新访问和共享对话。

adobe.podcast
AI驱动的音频 增强语音通过消...

Otter.ai
Otter.ai是一个自动的会议记录和笔记工具,帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议,以记录和分享笔记,突出关键要点,并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲,以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

讯飞听见
在线语音转文字,录音转文字

Open Voice OS
一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

Play.ht
Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。

VALL-E
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。

Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。