推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

2025-01-08 发布浏览392次点赞0次收藏0次

随着语音技术在各领域应用的迅速扩展，全球语言与口音的多样性成为技术进一步突破的重大挑战。为了应对这一难题，来自卡内基梅隆大学（CMU）、斯坦福大学（Stanford University）、乔治梅森大学(George Mason University)、台*大学与芝加哥丰田技术学院(TTIC)的研究团队连手，在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛（Multilingual SUPERB 2.0 Challenge）。该挑战旨在推动多语言语音技术迈向新高度，为语音科技的全球化应用奠定坚实基础。

语言数量规模

ML-SUPERB 2.0 提供了包含大量不同语言的语音数据集。

●训练集：涵盖 141 种语言的丰富语音数据，从主流语言到稀有方言，为参赛者提供多元化的语言资源以训练模型。

●开发集：包含训练集中的141种语言，和另外的56 种方言与口音，为模型性能的全面评估提供支持。

这些数据反映了全球语言的多样性，确保技术不仅服务于主流语言，更覆盖小众语言。

新型评估机制

ML-SUPERB 2.0 在评估机制上进行了创新，模型评估指针除了传统的语音识别和语言识别错误率外，还强调模型在每种语言上都具备稳定性能，真正做到对所有语言的友好支持，激励研究者关注小众语言与弱势语言的平等支持，最终实现“No Language Left Behind”。

主办方提供算力进行推论

为提升参赛体验，降低参赛门坎，挑战赛引入了在线实时排名系统。参赛者只需提交模型，即可由主办单位提供算力进行推论，实现快速评估与实时反馈。

引领语音科技的未来

ML-SUPERB 2.0 挑战赛不仅是一场技术比拼，更是推动语音科技迈向新纪元的重要一步。通过凝聚全球研究者与开发者的力量，挑战赛将加速多语言语音技术的创新与普及，为语音技术的应用场景带来更多可能性。参赛者可前往官方网站 (https://multilingual.superbbenchmark.org/) 获取详细信息，并在 2025 年 2 月 7 日前提交结果。让我们携手参与这场语音技术的盛会，见证语音科技未来的开启！

算力性能体验训练模型产业

声明：本文转载自机器之心，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。