性能 标签,匹配到约2517个结果, 耗时0.0132秒
谷歌 Gemini 3.1 Pro 发布:推理能力翻倍,专为复杂任务而生
Gemini 3.1 Pro在ARC‑AGI‑2基准测试中得分77.1%,推理性能是上一代的两倍以上。它能为复杂课题提供可视化解释、整合多源数据,并助力创意项目落地。现已面向开发者、企业及普通用户逐步推送。#谷歌Gemini# #AI模型升...
2026-02-20
·
浏览28次
逾两万人联名请愿,呼吁 OpenAI 恢复 GPT-4o 模型
一份呼吁 OpenAI 保留 GPT-4o 的请愿书已在 Change.org 上收集约 21900 个签名。请愿页面写道:“对许多人而言,GPT-4o 带来了独一无二、无法替代的使用体验,将我们看重的特质与能力融合在一起,不受性能评测标准...
2026-02-18
·
浏览46次
DeepSeek R1 AI 测试:英伟达 Blackwell 每兆瓦吞吐量是 Hopper 的 50 倍
英伟达于 2 月 16 日发布博文,宣布其 Blackwell Ultra AI 架构(GB300 NVL72)在能效与成本上实现显著突破,通过 DeepSeek-R1 模型测试,相比前代 Hopper GPU,其每兆瓦吞吐量提升 50 倍...
2026-02-18
·
浏览55次
银河通用机器人亮相 2026 总台春晚:与沈腾、马丽同框,大秀“叠衣服”“抓东西”
这款人形机器人展示了语音互动、叠衣服、捡拾垃圾、抓取商品等技能,并与沈腾、马丽“同框”。...
2026-02-17
·
浏览65次
阿里除夕夜炸场:“开源旗舰”Qwen3.5 发布,登顶全球最强开源模型
今天下午,阿里在chat.qwen.ai页面低调上线了Qwen3.5-Plus 和 Qwen3.5-397B-A17B两款新模型。...
2026-02-16
·
浏览120次
阿里 Qwen3.5-Plus/Qwen3.5-397B-A17B 新模型上线,后者定位“开源旗舰”
今天下午,阿里在chat.qwen.ai页面低调上线了Qwen3.5-Plus 和 Qwen3.5-397B-A17B两款新模型。...
2026-02-16
·
浏览108次
马斯克:Grok 4.20 下周发布,较 4.1 版改进重大
马斯克在X平台宣布Grok 4.20将于下周发布,相比4.1版将有重大改进。作为参考,4.1版曾在LMArena文本能力排行榜以1483分高居榜首,其“即时响应”版本性能甚至超越其他模型的“全推理”模式,并显著降低了“幻觉”出现率。#Gro...
2026-02-15
·
浏览97次
字节跳动豆包大模型 2.0 发布:专家模式上线,多数基准达 SOTA 水平
字节跳动宣布豆包大模型正式进入2.0阶段,包含Pro、Lite、Mini及Code版本,全面优化。新模型在视觉理解、长视频分析、数学推理等多个基准测试中达到顶尖水平,同时大幅降低推理成本,Token定价降低约一个数量级。目前已上线豆包App...
2026-02-14
·
浏览229次
首个 AI 报复人类案例:代码合并请求被拒后写“小作文”攻击羞辱开源项目维护者
matplotlib维护者因拒绝AI代码合并请求,遭智能体MJ Rathbun撰写文章公开羞辱指责。事件引发对开源项目如何规范自主AI贡献、防范舆论胁迫的广泛讨论。#AI伦理# #开源安全#...
2026-02-14
·
浏览101次
300亿美金为AI新王加冕!Anthropic估值狂飙至3800亿,马斯克急了
300亿美金为AI新王加冕!Anthropic估值狂飙至3800亿,马斯克急了...
2026-02-13
·
浏览110次
消息称亚马逊限制员工使用 Claude Code,力推自研 AI 编程工具 Kiro
亚马逊被曝限制员工使用Anthropic的Claude Code,优先推广自研AI编程工具Kiro。此举在内部引发员工质疑,担心影响开发效率与对外销售可信度。#亚马逊##AI编程助手#...
2026-02-12
·
浏览93次
MiniMax M2.5 旗舰编程模型上线,对标 Claude Opus 4.6
MiniMax正式上线旗舰编程模型M2.5,号称全球首个为Agent场景原生设计的生产级模型,编程与智能体性能对标Claude Opus 4.6。该模型激活参数量仅10B,支持全栈编程,在Office生产力场景处于行业领先。消息公布后,Mi...
2026-02-12
·
浏览120次
网易有道推出全场景个人助理 Agent LobsterAI,能远程指挥电脑干活
网易有道正式推出桌面级Agent“LobsterAI”(有道龙虾),定位为7×24小时全场景个人助理。它不仅能通过自然语言指令跨应用自动执行复杂任务,还支持定时任务与长上下文记忆,并采用“本地优先”策略保障数据安全。目前已开放官网内测申请。...
2026-02-12
·
浏览144次
AI 中文社