库克最后一届WWDC，把苹果AI九年的地基掀了

2026-06-10 发布浏览206次点赞0次收藏0次

【导读】苹果把服役9年的Core ML一刀砍了，全新Core AI从第一行代码为大模型重写。200亿参数直接塞进手机闪存跑推理，25亿台设备同时向AI巨头敞开大门。

库克最后一届WWDC，把苹果的AI地基掀了。

苹果把服役9年的Core ML一刀砍掉，取代它的Core AI从第一行代码开始为大模型重写。

苹果给所有AI画了同一条线

全新的Core AI是苹果专为大模型时代设计的端侧AI推理框架。

它统一调度CPU、GPU和Neural Engine三颗芯片，原生支持自回归生成、流式响应和多轮对话这些LLM的基础能力，覆盖iOS 27、macOS 27一直到watchOS 27的全平台。

简单来说，Core ML是给传统机器学习用的，Core AI是给大模型用的。

与此同时，配套的工具链也全部重做。

全新的.aimodel模型格式，苹果开源的coreai-torch转换工具包，加上Xcode里的性能调优和提前编译功能，从模型转换到部署上架的整条链路都覆盖了。

举个语言学习App的例子。

学生拿起手机对准一只蜂鸟，SAM3在端侧同时完成两件事，识别出画面中的物体是「Hummingbird」，并把蜂鸟从背景中精准分割出来，生成一张干净的卡片配图。

随后，一个0.6B参数的Qwen模型接管文本部分，拿着识别结果生成一张结构化的单词卡，中文词、英文释义、例句，三个字段各归各位，返回的是一个Swift原生类型，不是一坨需要再解析的文本。

整个流程不联网，不调API，全部跑在手机本地。

在这背后，是苹果官方维护的coreai-models仓库，里面放着Qwen、Mistral、SAM3等预优化的开源模型，全部针对Apple Silicon做过适配。开发者拉下来，几行Swift代码就能在自己的App里跑起来。

如果不想用现成的，自己的模型也能上。

苹果在GitHub上同步开源了coreai-torch工具包，5行Python就能把一个PyTorch模型转成.aimodel格式，丢进Xcode里进行编译部署。

项目地址：

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

不过，苹果想要的不只是跑模型，是统一所有模型。

落到技术上，就是Foundation Models框架里新加的Language Model协议。它定义了一套统一的Swift API，任何模型只要遵循它，就能被同一套代码调用。

苹果自家的端侧模型遵循这个协议，Core AI跑的开源模型遵循这个协议，Claude和Gemini这样的云端大模型也遵循这个协议。

一套代码，三种模型，从本地到云端无缝切换。苹果把自己变成了AI的路由层。

手机闪存里藏了个200亿大模型

Foundation Models框架背后跑的，是苹果与谷歌联合开发的第三代自研模型家族AFM 3，一口气发了5个模型。

端侧两个：

1. AFM 3 Core是3B参数的密集模型，负责日常轻量任务；

2. AFM 3 Core Advanced是20B参数的稀疏模型，苹果端侧的天花板。

云端三个：

1. AFM 3 Cloud是服务器主力；

2. ADM 3 Cloud专攻图像生成和编辑（Image Playground背后就是它）；

3. AFM 3 Cloud Pro是全家族最强。

其中，端侧的大杀器叫AFM 3 Core Advanced，200亿参数的大模型，直接跑在手机上。

按常理，手机的内存根本塞不下这个体量。传统大模型要求所有权重都装进DRAM，200亿参数连桌面级设备都吃力。

对此，苹果的解法叫Instruction-Following Pruning。

完整模型存在闪存（NAND）里，收到请求后，一个轻量级路由模块先选出需要激活哪些专家，再把那部分权重加载到DRAM中。每次实际调动的参数量在10亿到40亿之间，取决于任务复杂度。

一个200亿参数的模型，干活的时候只用其中5%到20%，剩下的安安静静躺在闪存里等召唤。

云端这边，是苹果最强的服务器模型——AFM 3 Cloud Pro。

为了攻下复杂推理和Agent工具调用，苹果联合谷歌、英伟达，把Private Cloud Compute扩展到了谷歌云的英伟达GPU上。隐私规则照旧，数据不出域。

实测结果也在佐证这套架构的效果。

AFM 3 Core在45.6%的测试prompt上被判定优于上一代，上一代的优势率只有23.3%。云端的AFM 3 Cloud差距更夸张，64.7%对8.7%，几乎是单方面碾压。

架构和跑分都说完了，开发者最关心的问题来了，这套东西要多少钱。

如果你的App在App Store的首次下载量低于200万，Private Cloud Compute的云端推理完全免费，零API成本，零token费用。你只管来写App就完了。

可以说，这个门槛精准卡在了独立开发者和中小团队的位置上。

三行代码，Claude上桌

在公开发布的第三方适配中，Anthropic是第一个交卷的。

6月8日WWDC keynote结束的同一天，Anthropic当即发布了一个Swift包，正式接入Foundation Models框架，6月9日起可用。

思路很简单。

苹果的端侧模型擅长摘要、信息抽取、分类这些轻量任务，速度快、不联网、零成本。但碰到多步推理、代码生成、联网搜索这些复杂需求，端侧模型就扛不住了。

而Claude的Swift包精准卡在了这个接缝上。

开发者在Foundation Models框架里正常调用苹果的端侧模型，当任务超出端侧能力时，框架自动把请求路由给Claude，响应结果以流式方式返回到同一个SwiftUI视图里。

用户全程感知不到切换，对他们来说这就是一个App。

换句话说，如果你常用的某个笔记App或学习App突然变聪明了，能帮你做跨文档的语义分析了，背后很可能就是开发者接了这个包。

比如，一个日记App可以用端侧模型生成每日写作提示，但当用户问「这几个月的日记有什么共同主题」时，这种跨时间的语义归纳就自动交给Claude来处理。

不过，Anthropic在苹果生态里的布局不止这一步。

Claude Agent早在今年2月就已经整合进了Xcode 26.3，帮开发者写代码、跑测试、做自动化。

但Xcode里的Claude面向的是开发者自己，Foundation Models里的Claude面向的是App的最终用户。

对Anthropic来说，这是一张迟到但关键的消费级分发入场券。

Claude一直在开发者和企业市场上打得很猛，但在普通消费者面前几乎没有存在感。

这次，苹果的Foundation Models框架，给了它一条触达十亿量级用户的通道。

25亿设备，一座擂台

回看库克最后一届WWDC的全部动作，一条线索贯穿始终。

苹果不想做AI模型公司。它把Siri的大脑交给了谷歌，把开源模型的运行时交给了Core AI，把第三方AI的选择权交给了用户。

它要做的是擂台。

25亿台设备，统一的Language Model协议，从端侧到云端的完整调度框架。

谁的模型好，谁就能通过这个平台触达地球上最大的高价值用户群。

AI巨头之间的竞争，从今天开始多了一个全新的维度。

之前Anthropic和OpenAI抢的是API调用量、开发者工具、企业合同。

现在苹果把战场搬到了每个人的口袋里，谁能拿下那个「默认AI引擎」的位置，谁就赢了下一局。

9月1日，John Ternus接任苹果CEO。他继承的不只是一家硬件公司，还有库克留下的这座AI擂台。

参考资料：

https://developer.apple.com/documentation/FoundationModels

https://developer.apple.com/documentation/coreai

https://claude.com/blog/claude-for-foundation-models

编辑：摩西

CEO 谷歌性能服务器框架写作 C macOS models AI 英伟达 mod 大模型芯片测试 OpenAI 库克苹果 iOS Claude Python Qwen Agent

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

库克最后一届WWDC，把苹果AI九年的地基掀了

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。