推动多语言语音科技迈向新高度:INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛
随着语音技术在各领域应用的迅速扩展,全球语言与口音的多样性成为技术进一步突破的重大挑战。为了应对这一难题,来自卡内基梅隆大学(CMU)、斯坦福大学(Stanford University)、乔治梅森大学(George Mason University)、台*大学与芝加哥丰田技术学院(TTIC)的研究团队连手,在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛(Multilingual SUPERB 2.0 Challenge)。该挑战旨在推动多语言语音技术迈向新高度,为语音科技的全球化应用奠定坚实基础。
语言数量规模
ML-SUPERB 2.0 提供了包含大量不同语言的语音数据集。
●训练集:涵盖 141 种语言的丰富语音数据,从主流语言到稀有方言,为参赛者提供多元化的语言资源以训练模型。
●开发集:包含训练集中的141种语言,和另外的56 种方言与口音,为模型性能的全面评估提供支持。
这些数据反映了全球语言的多样性,确保技术不仅服务于主流语言,更覆盖小众语言。
新型评估机制
ML-SUPERB 2.0 在评估机制上进行了创新,模型评估指针除了传统的语音识别和语言识别错误率外,还强调模型在每种语言上都具备稳定性能,真正做到对所有语言的友好支持,激励研究者关注小众语言与弱势语言的平等支持,最终实现“No Language Left Behind”。
主办方提供算力进行推论
为提升参赛体验,降低参赛门坎,挑战赛引入了在线实时排名系统。参赛者只需提交模型,即可由主办单位提供算力进行推论,实现快速评估与实时反馈。
引领语音科技的未来
ML-SUPERB 2.0 挑战赛不仅是一场技术比拼,更是推动语音科技迈向新纪元的重要一步。通过凝聚全球研究者与开发者的力量,挑战赛将加速多语言语音技术的创新与普及,为语音技术的应用场景带来更多可能性。参赛者可前往官方网站 (https://multilingual.superbbenchmark.org/) 获取详细信息,并在 2025 年 2 月 7 日前提交结果。让我们携手参与这场语音技术的盛会,见证语音科技未来的开启!
声明:本文转载自机器之心,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。