Whisper是OpenAI开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练,这些数据是从网络上收集的。它被设计成对口音、背景噪音和技术语言具有健壮性,并且可以将多种语言的语音转录和翻译成英语。它是一种简单的端到端方法,实现为编码器-解码器Transformer。它还能够执行语言识别和短语级时间戳。它的设计易于使用,具有较高的准确性,允许开发人员为更多的应用程序添加语音接口。
类似的工具
免费AI 中文社
AI 中文社区 - 一个学习交流 AI 人工智能技术的中文社区
在问
在问|全能又免费的人工智能网站。宗旨:让知识无界,智能触手可及
Midjourney提示词(咒语)生成器
Midjourney提示词(咒语)是一个免费在线生成器,可以快速生成midjourney关键词、咒语的实用工具平台,内置2000+宝典,实时翻译,利用Midjo
云雀大模型
云雀大模型,字节研发的大模型产品,字节的云雀大模型是首批上线的8家大模型之一。
反谱
人工智能实现音乐转乐谱和人声伴奏分离
Dify
简单易用的开源 LLMOps 平台,定义你的 AI 原生应用
他人最近看的工具
Midjourney提示词(咒语)生成器
Midjourney提示词(咒语)是一个免费在线生成器,可以快速生成midjourney关键词、咒语的实用工具平台,内置2000+宝典,实时翻译,利用Midjo
Opus
使用AI生成文本到视频。计算生产-从场景,资产,角色,对话和视觉效果的一切。
Unscreen.com
删除视频背景,100%自动和免...
阿里云金融级实人认证
实人认证是对用户身份信息真实性核验的服务,验证用户为真人且为本人。包含证件 OCR 识别、活体检测、人脸对比等能力,广泛应用于用户注册场景。
瀚博半导体
自研高端GPU芯片及解决方案提供商
灵医智惠
构建多项医疗专项能力,覆盖临床、科研、管理、患者服务等多环节,支撑院内院外多种解决方案
AI 中文社
