语音识别 标签,匹配到约5个结果, 耗时0.1396秒
豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语

豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语

豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语
模型推理能力提升,通过深度理解上下文完成精准识别,上下文整体关键词召回率提升 20%;支持多模态视觉识别,不仅“听懂字”还能“看懂图”,通过单图和多图等视觉信息输入让文字识别更精准;支持日语、韩语、德语、法语等 13 种海外语种的精准识别。...
2025-12-05 · 浏览131次
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源

打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源

打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
Meta推出全语种自动语音识别系统(Omnilingual ASR),支持1600种语言,其中500种首次被AI覆盖。该系统采用开源协议,助力跨语言沟通与信息可及性。#人工智能# #语音识别#...
2025-11-11 · 浏览183次
伦敦政经学院斥资 400 万英镑建立新研究中心,探索用 AI 架起人、宠物沟通之桥

伦敦政经学院斥资 400 万英镑建立新研究中心,探索用 AI 架起人、宠物沟通之桥

伦敦政经学院斥资 400 万英镑建立新研究中心,探索用 AI 架起人、宠物沟通之桥
该中心首任主任乔纳森·伯奇教授表示,尽管能理解宠物想表达什么听起来令人兴奋,但AI往往倾向于生成讨好用户而非反映真实意图的回答。“如果这项技术被应用于动物福利领域,可能会带来灾难性后果。”...
2025-07-14 · 浏览223次
联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型

联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型

联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型
这一名为MR BreezeASR 25的模型以 Apache 2.0 许可开源公布,不会出现将“发生什么事”听成“花生什么事”等类似识别错误。...
2025-07-03 · 浏览287次
13个优秀开源语音识别引擎

13个优秀开源语音识别引擎

13个优秀开源语音识别引擎
2024年已开始,AI热度不减,以下是几个截止目前比较优秀的开源语音识别引擎。...
2024-01-09 · 浏览3366次
上一页 · 下一页 · 当前第1页