先来句激动人心的口号:人工智能的未来是开放的,它属于人民!在Pable 5被禁之际,GLM就是人类的曙光啊~
- 1M上下文
- 好像还不支持多模态
- 编程能力无限逼近御二最新模型,稳坐世界第三。
本以为大模型会慢慢进入平淡期,没想到国产模型掀起另外一种浪潮,就是替代~~~
下面是目前为止各个评测结果
(1)一个私人编程测试排行
(2)KingBench

截至2026年6月13日,GLM-5.2已官宣,核心是100万Token真实可用上下文、更强代码能力、长程任务稳定性升级、推理效率优化、MIT开源,相比5.1是全面强化而非小修。
一、核心升级(对比GLM-5.1)
• 上下文窗口:200K → 1M(真正可用)
5.1为20万token;5.2正式支持100万token无损上下文,可完整读整个代码库/百万字文档,无信息丢失、逻辑断层。
• 代码能力:全球第一再强化
5.1在SWE-bench Pro达58.4(超GPT-5.4、Claude Opus 4.6);5.2为智谱迄今最强开源编码模型,长代码理解/生成、仓库级任务能力显著提升。
• 长程任务:8小时 → 12小时+稳定自治
5.1支持8小时+连续Agent任务;5.2进一步优化,12小时+多轮工具调用/复杂推理不崩,适合大型项目重构、全链路工程化。
• 推理速度:400 tokens/s → 500 tokens/s+
延续5.1高速版优势,生成速度再提升25%+,批量生成/高频编码更流畅。
• 幻觉率:再降30%+,事实准确性更高
复杂推理、长文档摘要、代码生成的幻觉问题进一步收敛。
• 开源策略:MIT商用零门槛
5.1为MIT开源;5.2下周正式开源(MIT),可商用、可修改、可闭源衍生,无限制。
• 底层架构:MoE+DSA优化
延续744B总参数、40B激活参数轻量化MoE;DSA稀疏注意力升级,长序列计算成本再降20%+。
二、关键差异速览
• 上下文:5.1=200K;5.2=1M(真实可用)
• 代码:5.1=SWE-bench Pro 58.4;5.2=最强开源编码
• 长程:5.1=8小时+;5.2=12小时+稳定
• 速度:5.1=400 tokens/s;5.2=500 tokens/s+
• 幻觉:5.1=降42%;5.2=再降30%+
• 开源:5.1=MIT;5.2=MIT(下周全量开源)
三、上线节奏
• 6月13日:GLM Coding Plan全量开放(Lite/Pro/Max/团队版)
• 6月16日(下周):API上线、模型正式开源(MIT)