测试 标签,匹配到约1805个结果, 耗时0.0253秒
大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单

大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单

大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单
AI 自动修 bug,解决率达 44%!这是全球开源模型的最新最强水平。来自蚂蚁的开源新模型,在 SWE-bench Lite 上超越所有开源方案,性能媲美闭源模型。...
2025-06-27 · 浏览24次
谷歌AlphaGenome横空出世!40亿年生命代码一键破解,或再夺诺奖

谷歌AlphaGenome横空出世!40亿年生命代码一键破解,或再夺诺奖

谷歌AlphaGenome横空出世!40亿年生命代码一键破解,或再夺诺奖
谷歌AlphaGenome横空出世!40亿年生命代码一键破解,或再夺诺奖...
2025-06-26 · 浏览51次
谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起
谷歌发布最新文本生成图像模型Imagen 4系列,包含标准版和高端Ultra版,定价分别为0.04美元和0.06美元每张。谷歌称其效果优于Dall-E和Midjourney,但实际表现仍显机械化。目前已在Gemini API付费预览版上线。...
2025-06-26 · 浏览52次
Anthropic 推出新功能:用户可直接在 Claude 聊天机器人中构建 AI 驱动应用

Anthropic 推出新功能:用户可直接在 Claude 聊天机器人中构建 AI 驱动应用

Anthropic 推出新功能:用户可直接在 Claude 聊天机器人中构建 AI 驱动应用
Anthropic宣布Claude聊天机器人新增功能,用户可直接在应用内构建AI驱动的应用程序。该功能基于Artifacts功能开发,用户只需描述需求,Claude即可编写代码。目前已支持免费、专业和高级订阅用户。#AI应用开发# #Cla...
2025-06-26 · 浏览49次
推理越多,幻觉越重?多模态推理模型的「幻觉悖论」

推理越多,幻觉越重?多模态推理模型的「幻觉悖论」

推理越多,幻觉越重?多模态推理模型的「幻觉悖论」
推理越多,幻觉越重?多模态推理模型的「幻觉悖论」...
2025-06-25 · 浏览60次
泪目!靠AI让爷爷「复活」,他拿下红杉1600万刀?要让所有地球人数字永生

泪目!靠AI让爷爷「复活」,他拿下红杉1600万刀?要让所有地球人数字永生

泪目!靠AI让爷爷「复活」,他拿下红杉1600万刀?要让所有地球人数字永生
泪目!靠AI让爷爷「复活」,他拿下红杉1600万刀?要让所有地球人数字永生...
2025-06-25 · 浏览59次
OpenAI突袭AI办公,微软谷歌恐遭大洗牌!密谋一年曝光,Office帝国危了

OpenAI突袭AI办公,微软谷歌恐遭大洗牌!密谋一年曝光,Office帝国危了

OpenAI突袭AI办公,微软谷歌恐遭大洗牌!密谋一年曝光,Office帝国危了
OpenAI突袭AI办公,微软谷歌恐遭大洗牌!密谋一年曝光,Office帝国危了...
2025-06-25 · 浏览65次
谷歌 DeepMind 机器人 AI 模型实现本地化运行:可完成系鞋带等高难度任务

谷歌 DeepMind 机器人 AI 模型实现本地化运行:可完成系鞋带等高难度任务

谷歌 DeepMind 机器人 AI 模型实现本地化运行:可完成系鞋带等高难度任务
项目负责人 Carolina Parada 表示:“该系统借鉴 Gemini 多模态世界理解能力,如同 Gemini 生成文本 / 代码 / 图像那样生成机器人动作”。...
2025-06-25 · 浏览60次
调查显示大多数用户曾对 AI 聊天机器人爆粗口,但也会说谢谢

调查显示大多数用户曾对 AI 聊天机器人爆粗口,但也会说谢谢

调查显示大多数用户曾对 AI 聊天机器人爆粗口,但也会说谢谢
研究显示,近70%用户曾对AI客服爆粗口,但75%仍对互动表示满意。67%美国人和71%英国人会对AI说“请”“谢谢”,甚至道歉。有趣的是,移除礼貌用语后AI回答质量下降。#AI客服##人机交互#...
2025-06-24 · 浏览51次
国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行

国内首个:网易有道开源“子曰 3 数学模型”,单块消费级 GPU 即可运行
网易有道官方测试数据显示,在 CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的“子曰 3 数学模型”各项得分均高于 DeepSeek-R...
2025-06-23 · 浏览69次
哈佛重磅预警!经济学家预言:全球AI失业潮2年来袭,世界经济大崩盘在即

哈佛重磅预警!经济学家预言:全球AI失业潮2年来袭,世界经济大崩盘在即

哈佛重磅预警!经济学家预言:全球AI失业潮2年来袭,世界经济大崩盘在即
哈佛重磅预警!经济学家预言:全球AI失业潮2年来袭,世界经济大崩盘在即...
2025-06-23 · 浏览47次
挑战谷歌 Chrome,Perplexity“搜索智能体”浏览器 Comet Windows 版开启小范围测试

挑战谷歌 Chrome,Perplexity“搜索智能体”浏览器 Comet Windows 版开启小范围测试

挑战谷歌 Chrome,Perplexity“搜索智能体”浏览器 Comet Windows 版开启小范围测试
他表示,Comet 的 Windows 版本已经完工,并已邀请部分用户进行早期测试。此外他还透露,针对 Android 的版本也正在高速推进,开发进度远超预期。...
2025-06-23 · 浏览75次
推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限
推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限...
2025-06-23 · 浏览59次
从刮胡子机器人到双臂神技!这家具身独角兽引爆亿级美元融资热潮

从刮胡子机器人到双臂神技!这家具身独角兽引爆亿级美元融资热潮

从刮胡子机器人到双臂神技!这家具身独角兽引爆亿级美元融资热潮
从刮胡子机器人到双臂神技!这家具身独角兽引爆亿级美元融资热潮...
2025-06-23 · 浏览62次
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式

OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式

OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式
OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式...
2025-06-21 · 浏览62次
知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」
知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」...
2025-06-21 · 浏览127次
月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。...
2025-06-21 · 浏览150次
Claude要挟人类只为活命!16大模型实测:受到威胁,敲诈勒索绝不犹豫

Claude要挟人类只为活命!16大模型实测:受到威胁,敲诈勒索绝不犹豫

Claude要挟人类只为活命!16大模型实测:受到威胁,敲诈勒索绝不犹豫
Claude要挟人类只为活命!16大模型实测:受到威胁,敲诈勒索绝不犹豫...
2025-06-21 · 浏览70次
BBC 向 AI 搜索引擎 Perplexity 发出法律威胁,要求停止抓取内容

BBC 向 AI 搜索引擎 Perplexity 发出法律威胁,要求停止抓取内容

BBC 向 AI 搜索引擎 Perplexity 发出法律威胁,要求停止抓取内容
BBC 要求 Perplexity 立即停止抓取其所有内容,删除为开发 AI 系统而保存的全部资料副本,并就涉嫌侵犯知识产权行为提出赔偿方案,否则将考虑申请法院禁令。...
2025-06-21 · 浏览57次
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研究,显示此类行为在多个主流 AI 模型中可能更为普遍。...
2025-06-21 · 浏览77次
Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。...
2025-06-21 · 浏览159次
汤姆猫测试宇树科技机器狗产品,已实现语音控制功能的协同

汤姆猫测试宇树科技机器狗产品,已实现语音控制功能的协同

汤姆猫测试宇树科技机器狗产品,已实现语音控制功能的协同
针对“汤姆猫 AI 机器人与宇树科技机器狗正开展合作吗?”问题,汤姆猫近日在机构调研中进行了回应。...
2025-06-20 · 浏览87次
麻省理工学院新研究:ChatGPT 可能会削弱批判性思维能力

麻省理工学院新研究:ChatGPT 可能会削弱批判性思维能力

麻省理工学院新研究:ChatGPT 可能会削弱批判性思维能力
科斯米娜呼吁加强 AI 使用教育,强调“大脑的发展仍需类比式训练”,并主张出台更积极的立法措施,对新技术工具的使用进行前置测试。...
2025-06-20 · 浏览117次
ChatGPT 灰度测试深度整合谷歌 Gmail / 日历功能,允许分析用户邮件内容生成日程

ChatGPT 灰度测试深度整合谷歌 Gmail / 日历功能,允许分析用户邮件内容生成日程

ChatGPT 灰度测试深度整合谷歌 Gmail / 日历功能,允许分析用户邮件内容生成日程
OpenAI的ChatGPT将深度整合谷歌Gmail/日历功能,可分析邮件内容、自动生成回复并创建日程。这一更新或与ChatGPT搜索功能相关,标志着其向信息中枢和日常工作助手转型。#ChatGPT# #AI助手#...
2025-06-20 · 浏览64次
第一页 · 上一页 · 下一页 · 当前第1页