Whisper是OpenAI开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练,这些数据是从网络上收集的。它被设计成对口音、背景噪音和技术语言具有健壮性,并且可以将多种语言的语音转录和翻译成英语。它是一种简单的端到端方法,实现为编码器-解码器Transformer。它还能够执行语言识别和短语级时间戳。它的设计易于使用,具有较高的准确性,允许开发人员为更多的应用程序添加语音接口。
类似的工具
他人最近看的工具
Open Voice OS
一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。
MetaVoice Studio
MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。
AI Competence
AI Competence一个在10秒左右为用户提供免费ai (GPT-3驱动)公司价值增值报告的工具。用户可以输入他们感兴趣的公司名称,然后将收到一份概述该公司重要信息的报告。该网站还为人工智能社区提供资源和灵感。
华为昇腾计算-Atlas 900
Atlas 900超级AI集群,算力巅峰
鲸选社区·鲸选频道
帮助数据人才在交流中享受学习,在实践中快速成长
墨芯人工智能
重新定义AI计算,为行业带来数量级算力提升
AI 中文社
