
68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩

最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。...
2025-05-02
·
浏览323次

AI 助手 Claude 进化:无缝接入团队工具、深度研究模式挑战复杂问题

Integrations 让 Claude 能无缝接入团队常用的工具,如 Jira 和 Asana;Advanced Research 模式则能在多数据源中深度调查长达 45 分钟,并生成带引用的详尽报告。...
2025-05-02
·
浏览358次

消息称微软 Azure 平台将托管马斯克的 Grok AI 模型

报道称微软已要求其 AI 基础设施工程师做好准备,Azure AI Foundry 平台将托管埃隆・马斯克(Elon Musk)旗下 xAI 公司开发的 Grok AI 模型。...
2025-05-02
·
浏览275次

Meta 训练 AI 引发版权争议,“合理使用”辩护遭法官质疑、拷问

Meta 面临的这起案件由多位作者于2023年提起,该公司被指控使用盗版书来训练 AI 模型,却未事先获得许可,也未支付任何报酬。...
2025-05-02
·
浏览287次

xAI 员工失误泄露 API 密钥近 2 个月,内部 AI 模型数据安全亮红灯

埃隆・马斯克(Elon Musk)旗下人工智能公司 xAI 的一名员工在 GitHub 上,无意泄露了一枚 API 密钥,这一失误持续了近两个月。...
2025-05-02
·
浏览281次

GitHub Copilot 用户规模超 1500 万,微软 CEO 纳德拉称已从编程助手进化为编程伙伴

在 2025 财年第 3 财季电话会议上,微软首席执行官纳德拉(Satya Nadella)表示 GitHub Copilot 已从“编程助手”进化到“编程伙伴”,尤其是 VS Code 的 Agent Mode,能自主迭代代码、识别并修复...
2025-05-02
·
浏览276次




库克回应个性化 Siri 功能延迟:专注打造高品质,尚需时间打磨

在今天召开的财报电话会议上,苹果公司首席执行官蒂姆・库克(Tim Cook)回应个性化 Siri 延后问题,表示该项目已取得重要进展,会尽快交付给消费者。...
2025-05-02
·
浏览222次

谷歌搜索上线 AI Mode:一问一答,聊天式智能解决你的复杂难题

谷歌公司昨日(5 月 1 日)发布博文,宣布为 Google Search 逐步推出专用 AI Mode 标签页,目前已邀请少数美国用户测试体验,并计划未来几周扩大测试范围。...
2025-05-02
·
浏览227次

BBC 用 AI“复活”侦探小说大师阿加莎・克里斯蒂

阿加莎于 1976 年去世,其形象通过结合授权图像、有限片段和过去的音频录音进行合成。这些数据与演员 Vivien Keene 混合,Keene 会在视频中“表演”阿加莎,然后替换面部。...
2025-05-02
·
浏览198次

谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图

Gemini 的本地图像编辑功能将从今天起逐步推向全球,预计在未来几周内,服务将扩展至大多数国家,并支持超过 45 种语言。...
2025-05-01
·
浏览257次

一句话搞定文献综述:中国科学院自动化研究所打造 ScienceOne,将实现全学科覆盖

ScienceOne 依托科学基础大模型,瞄准各学科的共性科学研究需求,从数据理解、计算优化、推理评估三个维度实现了能力突破,可平台式、规模化地赋能“假设提出-方案规划-仿真推演-实验验证-规律发现”科研全流程。...
2025-05-01
·
浏览307次

为满足数据中心大量电力需求,谷歌将资助培训数万名美国电工

对于许多科技公司来说,电力供应短缺已成为推动AI发展并依赖能源密集型数据中心的最大挑战。这些数据中心的能耗正在推动美国电力需求的上升,结束了近20年的需求停滞。...
2025-05-01
·
浏览242次

奥尔特曼投资公司在全美推出眼球扫描技术:借“火眼金睛”分辨人类和 AI

这家公司由联合创始人兼首席执行官 Alex Blania 领导,其将 Orb 描述为“一种强大的身份验证工具”,在 AI 深度伪造技术日益精确的今天能有效确认一个人是否真实存在。...
2025-05-01
·
浏览227次

微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1

微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。...
2025-05-01
·
浏览479次


Meta 发布 ReasonIR-8B:破解 AI 复杂推理检索难题,刷新 BRIGHT 纪录

Meta AI 推出 ReasonIR-8B 模型,专为推理密集型检索设计,不仅在检索精度上取得突破,其低成本和高效率也使其成为实际应用的理想选择。...
2025-05-01
·
浏览199次

微软承认可能数据中心建设进度无法及时跟上,恐将导致 AI 服务出现中断

“我们原本希望到第四季度末能够平衡需求,但正如大家所看到的,需求增长超出了预期。所以我们可能会有一些供给短缺,年底时会比较紧张。”...
2025-05-01
·
浏览264次


DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆

深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。...
2025-05-01
·
浏览560次

谷歌 Gemini AI 酝酿新高级订阅层级,Ultra 蓄势待发

科技媒体 testingcatalog 今天(5 月 1 日)发布博文,报道称谷歌计划扩展 Gemini AI 服务,可能扩展推出“Gemini Ultra”订阅层级。...
2025-05-01
·
浏览279次

网页版 Claude AI 酝酿升级:将支持 MCP 定制链接,扩展第三方服务集成

Anthropic旗下Claude网页应用计划通过MCP扩展定制集成支持,突破谷歌服务限制。MCP是Anthropic推出的开放标准,旨在统一LLM与外部数据源和工具的通信方式。这将让第三方服务提供商能直接向Claude用户开放工具。#AI...
2025-05-01
·
浏览226次