腾讯混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

2026-06-05 发布浏览156次点赞0次收藏0次

感谢网友江山已旧、Domado 的线索投递！

6 月 5 日消息，混元今日宣布提出 Stem 稀疏注意力算法，已被机器学习顶会 ICML-26 收录。

混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

官方表示，Stem 稀疏注意力算法从“因果信息流”重新审视块级稀疏，用 Token 位置衰减（TPD）和输出感知度量（OAM）两大创新，仅用 25% 算力就逼近稠密注意力的精度。配套的 HPC 算子库则将这份理论加速比真正转化为端到端的实测性能。

混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

▲ Stem 在 Hy3 preview（W8A8-FP8）上更贴近生产环境的真实落地数据

根据 Stem 算法 × HPC 算子的全栈加速方案，算法层面，Stem 通过 Token 位置衰减（TPD）和输出感知度量（OAM）实现 25% 预算下的近无损精度；算子层面，HPC 开源的 Stem+BSA 算子将稀疏收益转化为真实硬件加速，128K 上下文下首字延迟降低 3.6 倍。

混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

▲ 模型精度

附相关链接如下：

Stem 论文链接：https://arxiv.org/abs/2603.06274Stem
开源地址：https://github.com/Tencent/AngelSlimHPC
算子开源地址：https://github.com/Tencent/hpc-ops

腾讯混元算力性能 C

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

腾讯混元提出 Stem 稀疏注意力算法，首字延迟降低 3.6 倍

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。