宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov

2026-02-05 发布 · 浏览25次 · 点赞0次 · 收藏0次

2 月 5 日消息,AI 推理芯片初创企业 Positron 当地时间公布了其第二代 ASIC 设计 Asimov,宣称该产品的 Token 能效与性价比都可以达到英伟达 Rubin GPU 的五倍。

Positron 表示 Transformer 推理运行的限制在内存而非算力,因此 Asimov 在设计上就是以内存优先,拥有 90% 的内存带宽利用率,并从结构上消除不必要的远程数据移动。

Asimov 芯片由一对计算模块组成,内置支持多样化数据格式的脉动阵列。每个计算模块连接到 432GB 的 LPDDR5x 内存,并通过 PCIe 6.0 / CXL 3.0 连接到至多 720GB 的 KV Cache 缓存用内存。其芯片整体 TDP 为 400W,内存总容量 2304GB、总带宽 2.76 TB/s,支持风冷冷却。

Positron Asimov 支持多样化拓扑结构的 16Tbps 芯片间互联。其 Titan 推理服务器系统采用 19 英寸 4U 机架规格,聚合了 4 颗 Asimov 芯片,支持 16T 参数模型推理和 10M 上下文窗口,单系统最多 4096 套 Titan。

Positron 表示 Asimov 芯片目标在 2026 年底完成芯片流片,并在 2027 年初投入生产

宣称每美元、每瓦 Token 可达英伟达 Rubin 五倍,Positron 公布 AI 推理芯片 Asimov - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。