Whisper是OpenAI开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练,这些数据是从网络上收集的。它被设计成对口音、背景噪音和技术语言具有健壮性,并且可以将多种语言的语音转录和翻译成英语。它是一种简单的端到端方法,实现为编码器-解码器Transformer。它还能够执行语言识别和短语级时间戳。它的设计易于使用,具有较高的准确性,允许开发人员为更多的应用程序添加语音接口。
类似的工具
其他人也看的工具
序列猴子开放平台
极大地提高了生产效率和数据处理能力
讯飞星火认知大模型
免费使用-AI写作、AI百科、AI问答
NeutronField
NeutronField是一个专业策划的AI文本到图像提示市场。它使用户能够展示他们最好的人工智能文本转图像提示,并通过销售这些提示来赚钱。市场使得创建人工智能提示变得更容易、更经济,因为用户可以从其他提示工程师制作的现成文本提示开始。用户还可以免费分享他们的提示,或者选择因对人工智能社区的贡献而获得奖励。
Faceswap
根据用户上传的照片和视频进行人脸交换,生成有趣的照片和视频
MotionSound
AI智能生成语音技术,简单易用的文本转语音工具,能适应多场景需求,配音、演讲不再有烦恼
康奈尔大学
康奈尔大学(Cornell University),又译作“康乃尔大学”,主校区位于美国纽约州伊萨卡,是美国境内的一所私立综合类研究型大学,为常春藤联盟成员校、国际大学气候联盟成员校、美国公立与赠地大学协会成员校 、美国大学协会的十四个创始院校之一 。康奈尔大学位列QS世界大学排名(2023)第20名 ,位列软科世界大学学术排名(2022)第12名 。