Whisper是OpenAI开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练,这些数据是从网络上收集的。它被设计成对口音、背景噪音和技术语言具有健壮性,并且可以将多种语言的语音转录和翻译成英语。它是一种简单的端到端方法,实现为编码器-解码器Transformer。它还能够执行语言识别和短语级时间戳。它的设计易于使用,具有较高的准确性,允许开发人员为更多的应用程序添加语音接口。

类似的工具
其他人也看的工具

PaperYY
提供专业的论文重复率检测、论文降重、论文在线修改、论文格式规范等一站式服务

佐糖
佐糖专注于图像处理领域,提供丰富的图像处理工具,将复杂操作极致简化,真正实现让图像处理更简单。

TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。

Langotalk
这个工具可以帮助人们通过与人工智能聊天,以6倍的速度学习西班牙语、英语、法语、德语、荷兰语或意大利语。

Chato:数字员工_智能客服
打造企业AI智能化数字员工

woebot
woebot是您的个人心理健康盟友,可帮助您恢复自己的感觉。以临床研究为后盾,由 AI 提供支持。