OpenAI曝出第一颗芯片叫「辣椒」!AI自己设计,9个月流片

浏览26次 点赞0次 收藏0次

【导读】OpenAI首颗自研芯片Jalapeño问世,9个月白纸到流片,创下行业最快纪录。设计它的,正是跑在上面的AI模型。

就在刚刚,OpenAI掏出了史上第一颗自研芯片。

名字叫Jalapeño,墨西哥辣椒,专为大模型推理设计。


9个月前,白纸一张。

9个月后,工程样片不仅跑通了GPT-5.3-Codex-Spark,而且频率和功耗均已达到量产目标。

更离谱的是,这颗芯片是OpenAI用自己的AI帮着画的。

9个月,行业纪录碎了

Jalapeño,墨西哥辣椒里辣度最温和的品种之一。

OpenAI拿它给第一颗芯片命名,潜台词很可能是:这只是入门级,后面可能还有更辣的。

官方定位叫「Intelligence Processor」,一颗专为大模型推理设计的定制ASIC。

由OpenAI主导架构设计,Broadcom负责芯片实现和网络互联,Celestica做板卡和机架集成。


通常来说,先进半导体行业,设计一颗高性能ASIC要18到24个月。Google TPU两年一代,Amazon Trainium差不多也是这个的节奏。

而OpenAI只用了9个月,一举刷新了先进半导体领最快的ASIC开发周期。

这颗芯片从第一根线开始就只为一件事优化:LLM推理。

而且,Jalapeño不只跑OpenAI自家模型,架构上兼容全行业的LLM。


AI帮自己画了电路图

比性能更值得关注的,是这颗芯片怎么被造出来的。

OpenAI自家AI模型参与了这颗芯片的设计和优化。

也就是说——AI设计了一颗芯片,芯片反过来跑AI,跑在上面的更强AI会设计下一代更强的芯片。

AI,帮自己造了一副新身体。

AI设计芯片不新鲜。Google 2021年在Nature发论文,用强化学习做芯片布局,速度比人类快几个数量级。

此后AlphaChip连续优化了三代TPU布局方案。

OpenAI硬件团队的掌门人Richard Ho,正是从这个圈子里走出来的。


Google近九年,TPU高级工程总监,参与发明了ML设计芯片架构的方法,多个TPU项目首次流片即成功。

之后去了光子计算公司Lightmatter当高级副总裁,更早联合创办过EDA公司0-In Design Automation。学术界、芯片设计、AI硬件,整条路走了一遍。



OpenAI挖他来,大概率就是为了一件事:把「AI辅助芯片设计」嫁接到自家模型上。

芯片设计最磨人的不是「想方案」,是无数次的设计—验证—改—再验证循环。一颗先进芯片的验证要跑成千上万次,占掉整个周期的大半时间。

AI恰恰擅长干这种事——读历史设计数据、生成RTL代码、辅助验证和debug、优化布局布线。

能实现9个月流片,靠的是AI替人扛掉了那「18到24个月」里最磨人的一大块。

用最会用锤子的人,来设计新锤子。用最懂LLM运行规律的模型,来设计专门跑LLM的硬件。


你的ChatGPT账单正在被重写

OpenAI每年算力支出百亿美元级别,这些钱最终要从你身上赚回来——20美元月费、API调用、Plus和Pro订阅。

推理成本砍半,普通用户最先感受到的:响应变快。

现在ChatGPT高峰期排队、转圈、长对话变慢,本质都是算力不够分。

推理效率提升后,同等服务器能服务更多用户,体验有望改善。

其次:免费版能力放开。

现在很多功能锁在Plus里——深度研究、高级数据分析、完整版语音对话。

成本降了,这些功能下放给免费用户的可能性就大了。

而OpenAI需要的,正是让更多人用上ChatGPT,并且能用更久。

再往远看:20美元的月费可能还是20美元,但你拿到的东西完全不一样。

去年这个价格买到的是GPT-4o,明年同样的钱可能买到的是一个能跑完整工作流的agent。

月费没变,能力可能翻几番——推理成本下降带来的隐性降价。


但Jalapeño瞄准的不只是今天的ChatGPT。

Richard Ho的思路是:为模型要去的方向设计硬件,而不是为它现在的样子。

OpenAI内部能看到未来6到9个月模型的演进方向,芯片按这条管线往前造。

等agent真正跑起来,算力需求和今天的一问一答完全不是一个量级。

说白了,推理成本降下来,受益的不只是Pro用户。

学生、小企业、独立开发者,都可能用上今天只有大客户才跑得起的AI能力。

OpenAI要吃掉整条链

模型自己训,芯片自己设计,推理自己优化,部署自己控制。

换句话说,OpenAI要做全栈AI公司。

之前和Cerebras合作推理部署,OpenAI从中摸清了专用推理硬件的价值。现在自己下场做,把经验变成自己可控的平台。

Apple和Google都走过这条路。

但OpenAI的全栈多了一层:

用AI加速AI基础设施建设,再用更好的基础设施跑更强的AI。如果这个循环成立,飞轮会自己给自己加速。

首批GW级数据中心将和Microsoft等合作方从2026年底开始部署。

Jalapeño只是第一代,下一代叫什么还不知道。

但造它的,大概率不只是人了。

参考资料:

https://x.com/OpenAI/status/2069770172802773292

https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

编辑:摩西

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯