库克最后一届WWDC,把苹果AI九年的地基掀了

浏览19次 点赞0次 收藏0次

【导读】苹果把服役9年的Core ML一刀砍了,全新Core AI从第一行代码为大模型重写。200亿参数直接塞进手机闪存跑推理,25亿台设备同时向AI巨头敞开大门。

库克最后一届WWDC,把苹果的AI地基掀了。

苹果把服役9年的Core ML一刀砍掉,取代它的Core AI从第一行代码开始为大模型重写。


苹果给所有AI画了同一条线

全新的Core AI是苹果专为大模型时代设计的端侧AI推理框架。

它统一调度CPU、GPU和Neural Engine三颗芯片,原生支持自回归生成、流式响应和多轮对话这些LLM的基础能力,覆盖iOS 27、macOS 27一直到watchOS 27的全平台。

简单来说,Core ML是给传统机器学习用的,Core AI是给大模型用的。


与此同时,配套的工具链也全部重做。

全新的.aimodel模型格式,苹果开源的coreai-torch转换工具包,加上Xcode里的性能调优和提前编译功能,从模型转换到部署上架的整条链路都覆盖了。

举个语言学习App的例子。

学生拿起手机对准一只蜂鸟,SAM3在端侧同时完成两件事,识别出画面中的物体是「Hummingbird」,并把蜂鸟从背景中精准分割出来,生成一张干净的卡片配图。

随后,一个0.6B参数的Qwen模型接管文本部分,拿着识别结果生成一张结构化的单词卡,中文词、英文释义、例句,三个字段各归各位,返回的是一个Swift原生类型,不是一坨需要再解析的文本。

整个流程不联网,不调API,全部跑在手机本地。


在这背后,是苹果官方维护的coreai-models仓库,里面放着Qwen、Mistral、SAM3等预优化的开源模型,全部针对Apple Silicon做过适配。开发者拉下来,几行Swift代码就能在自己的App里跑起来。

如果不想用现成的,自己的模型也能上。

苹果在GitHub上同步开源了coreai-torch工具包,5行Python就能把一个PyTorch模型转成.aimodel格式,丢进Xcode里进行编译部署。

项目地址:

https://github.com/apple/coreai-models

https://github.com/apple/coreai-torch

不过,苹果想要的不只是跑模型,是统一所有模型。

落到技术上,就是Foundation Models框架里新加的Language Model协议。它定义了一套统一的Swift API,任何模型只要遵循它,就能被同一套代码调用。

苹果自家的端侧模型遵循这个协议,Core AI跑的开源模型遵循这个协议,Claude和Gemini这样的云端大模型也遵循这个协议。

一套代码,三种模型,从本地到云端无缝切换。苹果把自己变成了AI的路由层。


手机闪存里藏了个200亿大模型

Foundation Models框架背后跑的,是苹果与谷歌联合开发的第三代自研模型家族AFM 3,一口气发了5个模型。

端侧两个:

1. AFM 3 Core是3B参数的密集模型,负责日常轻量任务;

2. AFM 3 Core Advanced是20B参数的稀疏模型,苹果端侧的天花板。

云端三个:

1. AFM 3 Cloud是服务器主力;

2. ADM 3 Cloud专攻图像生成和编辑(Image Playground背后就是它);

3. AFM 3 Cloud Pro是全家族最强。


其中,端侧的大杀器叫AFM 3 Core Advanced,200亿参数的大模型,直接跑在手机上。

按常理,手机的内存根本塞不下这个体量。传统大模型要求所有权重都装进DRAM,200亿参数连桌面级设备都吃力。

对此,苹果的解法叫Instruction-Following Pruning。

完整模型存在闪存(NAND)里,收到请求后,一个轻量级路由模块先选出需要激活哪些专家,再把那部分权重加载到DRAM中。每次实际调动的参数量在10亿到40亿之间,取决于任务复杂度。

一个200亿参数的模型,干活的时候只用其中5%到20%,剩下的安安静静躺在闪存里等召唤。


云端这边,是苹果最强的服务器模型——AFM 3 Cloud Pro。

为了攻下复杂推理和Agent工具调用,苹果联合谷歌、英伟达,把Private Cloud Compute扩展到了谷歌云的英伟达GPU上。隐私规则照旧,数据不出域。

实测结果也在佐证这套架构的效果。

AFM 3 Core在45.6%的测试prompt上被判定优于上一代,上一代的优势率只有23.3%。云端的AFM 3 Cloud差距更夸张,64.7%对8.7%,几乎是单方面碾压。


架构和跑分都说完了,开发者最关心的问题来了,这套东西要多少钱。

如果你的App在App Store的首次下载量低于200万,Private Cloud Compute的云端推理完全免费,零API成本,零token费用。你只管来写App就完了。

可以说,这个门槛精准卡在了独立开发者和中小团队的位置上。

三行代码,Claude上桌

在公开发布的第三方适配中,Anthropic是第一个交卷的。

6月8日WWDC keynote结束的同一天,Anthropic当即发布了一个Swift包,正式接入Foundation Models框架,6月9日起可用。

思路很简单。

苹果的端侧模型擅长摘要、信息抽取、分类这些轻量任务,速度快、不联网、零成本。但碰到多步推理、代码生成、联网搜索这些复杂需求,端侧模型就扛不住了。

而Claude的Swift包精准卡在了这个接缝上。


开发者在Foundation Models框架里正常调用苹果的端侧模型,当任务超出端侧能力时,框架自动把请求路由给Claude,响应结果以流式方式返回到同一个SwiftUI视图里。

用户全程感知不到切换,对他们来说这就是一个App。

换句话说,如果你常用的某个笔记App或学习App突然变聪明了,能帮你做跨文档的语义分析了,背后很可能就是开发者接了这个包。

比如,一个日记App可以用端侧模型生成每日写作提示,但当用户问「这几个月的日记有什么共同主题」时,这种跨时间的语义归纳就自动交给Claude来处理。


不过,Anthropic在苹果生态里的布局不止这一步。

Claude Agent早在今年2月就已经整合进了Xcode 26.3,帮开发者写代码、跑测试、做自动化。

但Xcode里的Claude面向的是开发者自己,Foundation Models里的Claude面向的是App的最终用户。

对Anthropic来说,这是一张迟到但关键的消费级分发入场券。

Claude一直在开发者和企业市场上打得很猛,但在普通消费者面前几乎没有存在感。

这次,苹果的Foundation Models框架,给了它一条触达十亿量级用户的通道。

25亿设备,一座擂台

回看库克最后一届WWDC的全部动作,一条线索贯穿始终。

苹果不想做AI模型公司。它把Siri的大脑交给了谷歌,把开源模型的运行时交给了Core AI,把第三方AI的选择权交给了用户。

它要做的是擂台。

25亿台设备,统一的Language Model协议,从端侧到云端的完整调度框架。

谁的模型好,谁就能通过这个平台触达地球上最大的高价值用户群。


AI巨头之间的竞争,从今天开始多了一个全新的维度。

之前Anthropic和OpenAI抢的是API调用量、开发者工具、企业合同。

现在苹果把战场搬到了每个人的口袋里,谁能拿下那个「默认AI引擎」的位置,谁就赢了下一局。

9月1日,John Ternus接任苹果CEO。他继承的不只是一家硬件公司,还有库克留下的这座AI擂台。

参考资料:

https://developer.apple.com/documentation/FoundationModels

https://developer.apple.com/documentation/coreai

https://claude.com/blog/claude-for-foundation-models

编辑:摩西

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯