invideo
InVideo 使用现成的模板简化视频创建,即使您以前从未做过,也可以快速自定义这些模板。
SpeechEasy
SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单直观,采用隐私优先的方法来保护用户信息。
FakeYou
FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑的工具。它允许用户用自己喜欢的角色创建音频剪辑,还提供了人工智能的文本转语音功能。它也有一个视频口型社区,排行榜和赞助人feed。
Play.ht
Play.ht AI驱动的语音生成器和逼真的文本到语音(TTS)音频转换器使用在线AI语音生成器和最佳合成声音,以MP3和WAV格式立即创建自然的、专业质量的音频。为视频、电子学习课程、播客、IVR系统等创建自定义画外音,支持超过132种语言和口音,并完全支持SSML。
VALL-E
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。
Synthesizer V
Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。
Poly.ai
我们现在正在构建下一代语音助手,能够在客户服务中处理真正的人类对话。
coqui.ai
在几秒钟内克隆您的声音或从我们可用的 AI 声音中进行选择,每个版本都会添加更多.
WellSaid labs
WellSaid是一款人工智能文本转语音工具,允许用户根据文本创建真实、自然的画外音。它提供了一系列语音化身,并帮助团队在项目上协作,允许更快的生产时间。它适用于企业,可用于各种应用,如有声书、营销、客户支持等等。
LiSTNR
Listnr是一个人工智能语音生成器和文本到语音的在线工具,允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。
Resemble.ai
Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包,允许您在几秒钟内创建类似人类的声音。
MURF.AI
在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示
Uberduck
Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱工具创建自己的自定义语音克隆。
Speech Studio
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
Speechify
Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。
Verbatik
Verbatik是一款由人工智能驱动的文本到语音生成器,提供了一个不断增长的库,包含142种语言和口音的600多种自然声音。
DeepZen
DeepZen是一个数字语音解决方案平台,提供栩栩如生、情感丰富的文本音频内容。该公司为有声书、广告、营销、品牌语音以及播客、游戏和虚拟助手等其他类型的语音内容提供数字语音解决方案。
LOVO.AI
LOVO AI是下一代AI画外音&文本到语音平台
Eleven Labs
Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。
Quickie
Quickie是一个人工智能驱动的扩展,允许用户生成文本转语音、摘要器、扩展器、推特、歌词和其他功能。它还提供自定义快捷方式,允许用户使用提示和输入建立自己的快捷方式。Quickie是免费的,每个学分1个Quickie,有无限的Quickie付费计划,保存的结果,和无限的自定义Quickie。
TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。
Narration Box
Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的,并提供了分发、分析、盈利等工具。
AiSofiya
Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强音频效果。它是一款多功能工具,可用于客户服务聊天机器人、语音助手、教育聊天机器人、用于自然语言处理任务的文本生成等。
Blogcast™
BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供选择。该工具还提供托管、播客订阅、媒体播放器、WordPress插件,以及与RSS订阅同步的功能。
Beepbooply
Beepbooply是一款人工智能驱动的文本转语音工具,允许用户快速轻松地生成具有逼真声音的音频内容。超过80种语言、120种口音和900种声音,用户可以自定义他们的音频,并生成几个小时的高质量音频内容,只需点击一个按钮。Beepbooply提供个人和商业使用的免费和付费级别,并允许无限的下载和项目。
Spakfly
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音。它支持65种语言和400多种不同的声音,并有标准和AI(神经语音)选项。它还提供了一个灵活的定价模式,包括现收现付、套餐和订阅选项。
Audyo
Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。
Artflow.ai
Artflow.ai使用户能够轻松地使用ai生成的原始角色、场景、对话和资产创建动画故事。该工具还提供数百万用户生成的资产,并支持非英语描述。它提供人像2.0和新图像等功能,以及视频工作室功能。
Synthesys
Synthesys是一家领先的AI虚拟媒体平台,用户只需点击几下鼠标就可以制作专业的AI画外音和AI视频。它为用户提供了一个大型的专业声音库,74种humatar, 38种女性和36种男性声音,66种语言和254种风格。它还具有基于云的应用程序、完全定制和高分辨率输出。Synthesys非常适合创建解释器视频,电子学习,社交媒体,产品描述等。
Reachout.ai
Reachout.ai是一个人工智能驱动的视频开发平台,专为忙碌的企业家和销售团队打造,他们希望突破收件箱的噪音,大规模生成个性化视频,并获得更高的电子邮件回复率和更多与理想客户的会议。