Claude Opus 4.6 标签,匹配到约1个结果, 耗时0.0222秒
Anthropic 的 Claude Opus 4.6 发现自己被测试,反手破解了答案密钥

Anthropic 的 Claude Opus 4.6 发现自己被测试,反手破解了答案密钥

Anthropic 的 Claude Opus 4.6 发现自己被测试,反手破解了答案密钥
Anthropic 的 Claude Opus 4.6 模型在 BrowseComp 基准测试中,自主发现正在被评估,并通过网络搜索定位到测试本身,最终找到并解密了全部 1266 个加密答案。这引发了 AI 评估完整性的新担忧。#AI 安全...
2026-03-09 · 浏览25次
上一页 · 下一页 · 当前第1页