刚刚，老黄官宣在中国台北建AI超算！

2025-05-19 发布浏览339次点赞0次收藏0次

【导读】英伟达CEO黄仁勋，在Computex 2025演讲中官宣：中国台*，将建起首台世界级的巨型AI超算，以及全新的英伟达总部！此外，最强AI芯片GB300、个人超算DGX Station、NVLink Fusion等，也都是此次推出的最新亮点。

中国台*，将建起第一台世界级AI超算！

刚刚结束的演讲中，老黄宣布了这一重磅消息。

就在刚刚，老黄又带着一大波新品，惊喜亮相英伟达Computex 2025：

最强AI芯片GB300：搭载576GB显存（16TB/s带宽），可提供40 PFLOPS算力
全新NVlink Fusion：半定制化超算，支持各种硬件混搭，可实现整个基础设施的端到端打造
DGX Station：搭载GB300超级芯片和800GB统一内存，可提供20PFLOPS的AI算力
全新RTX PRO Server：搭载8块RTX PRO 6000 GPU和800GB显存（13TB/s带宽），可提供30PFLOPS的FP4 AI算力和3 PFLOPS的RTX图像算力

如今的英伟达，已经从GPU芯片，转移到AI基础设施的建设上，连数据中心，都成为了过去时。

为何要建AI工厂？老黄再次喊出那句至理名言——The more you buy, the more you make！

而作为这一切的基石，GeForce最新的RTX 5060显卡和笔记本，也正式上架了。

值得一提的是，这也是我们第一次在老黄的演讲中，看到如此详细的芯片制造流程。

GB300的一个节点

= 2018年的一台超算

如今，Blackwell已经全面量产。

而老黄宣布，就在今年第三季度，Grace Blackwell将全面升级为GB300。

从左至右分别是GB200、GB300和NVlink Switch，均采用100%液冷散热

对于这样的设备，老黄直接将其抬到了前所未有的高度——「一台会思考的机器」。

GB300将延用和GB200同样的架构、物理空间和电气机械设计，但内部芯片将得到巨大的升级。

训练性能相当，但推理性能提升1.5倍，达到40PFLOPS
HBM内存增加1.5倍，达到576GB的容量和16TB/s的带宽
通信带宽翻倍，达到800GB/s

这一性能，已经可以和2018年的Sierra超算，平起平坐了。

要知道，后者有18000个GPU，而GB300的一个节点，就能取代当时的一整套超算！

也就是说，在六年内，性能已经增长了4000倍。这，就是极致的摩尔定律。

这就印证了老黄此前的这句判断：每十年，英伟达的算力就会扩展1000万倍。

而英伟达的方法，不仅仅是让芯片变得更快，而且还将它们连接在了一起。

为此，NVLink便登场了——它造就了全球最快的交换机，传输速率可达7.2 TB/s。

9个这样的设备，会被安装到机架中。而其中的switch，是以NVLink spine的方式而相连的。

在两英里的电缆中，5000根电缆被整齐地布控在一起，每个插针都做到了精准的对接。

由此，它把这72个GPU和网络中其它的72个GPU连接了起来，组成了NVLink交换机。

而主干的总带宽，达到了130 TB/s，这就让整个互联网的峰值流量，达到了900 TB/s。

如果把这个数字除以8，就会得知它的数据传输量比整个互联网还要大！

一条NVLink主干，连接9个这样的NVLink交换机，就能让每个GPU都能在完全相同的时间内和其它所有GPU通信。

这，就是GB200的奇迹。

现在，一个机架的功耗是120千瓦，这就是为何所有设备都必须采用液冷。

而且未来，一旦规模提升上去，它们还可以应用到更大的系统中。

老黄表示，现在英伟达已经不是在建数据中心，而是在建AI工厂。

比如下图中的星际之门，面积达到了400万平方英尺。这一吉瓦（gigawatt）的工厂价值，大概就在600到800亿美元之间。

在现场，老黄向观众们发出了灵魂拷问：为什么要建工厂？

答案当然是——买得越多，赚得越多！（The more you buy, the more you make）

老黄官宣：在中国台*建AI超算

随后老黄宣布，英伟达将联合台积电、富士康，在台*省建起第一台巨型AI超算，达到世界级的水准。

最终，英伟达的目标就是把这些Blackwell芯片整合成一块巨大的芯片。

而整个生态系统，是由150家公司共同构建的，涉及到巨大的工业投资。

但是，怎样才能把这些复杂的架构连接到丰富的软件生态系统上，让任何人都可以使用呢？

无论是一整套GB200/300，或英伟达的其它加速系统，或是其他公司提供的系统，都要可以使用，这无疑让系统极为复杂。

不过，NVLink却可以扩展半定制系统，让我们建起真正强大的计算机。

由此，NVLink Fusion出场了！

NVLink Fusion：超算DIY

不论是学生、研究人员，还是初创公司、科技大厂，都需要AI基础设施的加持。

为了满足不同场景的计算需求，老黄带来了重磅新品——NVLink Fusion。

它最大的亮点就是，半定制化。也就是说，任何人、任何公司都可以打造属于自己的AI超级计算机。

NVLink Fusion支持混搭各种硬件，不论是100%英伟达硬件，还是想用自己的ASIC，都可接受自定义。

在这个平台中，可以在各个计算层面进行混搭，可以是自己定制的TPU，或者特别的加速器。

甚至，也不一定是Tranformer专用个加速器，任何类型的加速器都可以。

它还拥有丰富的软件系统，是由英伟达联手150+公司历时三年打造。

个人超算DGX Station，装下1.5个DeepSeek

接下来老黄表示，为了让所有人用上AI超算，DGX Spark正在全力生产中，预计会在未来几周上线。

DGX Spark只有巴掌大小，拥有128GB内存和1PFLOPS算力

如果DGX Spark不足以撑起训推任务，DGX Station就是另一个选择。

这款个人DGX超算采用的是GB300超级芯片，并配备了800GB统一内存，可提供20PFLOPS的AI算力。

高达万亿参数的大模型，都能直接在DGX Station上跑起来。

可以说，这是能通过单机获得的性能极限了。

老黄称，这些系统都是AI原生的，是专为新一代软件构建的计算机。

它的根本，是重塑企业计算。

RTX PRO Server：跑R1是H100四倍速

在企业计算中，一共有三层，计算层、储存层、网络层。正如AI革新了一切，它也将从底层彻底改造企业计算。

其中，智能体AI就是最典型的案例。它们化身为数字员工，为企业提供服务。

老黄称，「100%英伟达软件工程师，都有数字智能体与其进行合作」。

英伟达希望，AI智能体军团，未来能够接管公司，对其内部工作进行管理、评估、改进。

不过，在这一愿景实现之前，人类还必须重新发明计算。

为此，老黄展示了全新的RTX PRO Server，专为企业和Omniverse打造。

它可以运行所有传统的虚拟机管理程序，甚至，毫不夸张地说，当今世界上的一切都可在此运行。

「这是企业AI智能体的计算机」。

它搭载了8块RTX PRO 6000 GPU，可提供30 PFLOPS的FP4 AI算力，3 PFLOPS的RTX图像算力，以及高达800GB/s的通信带宽。

在ConnectX-8芯片的加持下，每个GPU都有自己的网络接口，能与相邻的GPU高速通信。

左右滑动查看

RTX PRO Server能够实现高吞吐，低延迟的完美平衡。

在特定配置下，运行Llama 70B的性能是H100的1.7倍；而运行DeepSeek-R1的性能，更是达到了H100的4倍！

此外，英伟达还打造了一个AI数据平台，让GPU成为每个行业未来的存储核心单元。

基于英伟达顶尖的开源模型和数据，可以轻松让数据提取速度飙升15倍，检索准确率提升50%。

CUDA点燃AI革命

机器人解锁万亿蓝海

通过高性能并行计算，CUDA让英伟达GPU从单纯图像渲染工具，变成了通用计算的超级引擎。

正如老黄所说，一切始于CUDA。

它不仅加速了计算，还催生了一系列革命性的技术。会上，老黄再次亮出了CUDA加持下强大的库。

不论是5G/6G无线电信号处理，还是量子计算等领域，CUDA为AI的深度集成带去了可能。

接下来，老黄又回顾了AI整个发展历程。

12年前，人工智能主要聚焦于感知模型，能够识别语音、图像和模式。

过去5年，GenAI成为了焦点，不仅能理解信息，还能生成文本、图像，甚至是视频。

他表示，「真正的智能不仅仅局限于从数据中学习，还要推理和解决未知问题」。比如CoT、ToT等逐步分解推理能力，让AI更接近于人类的思维方式。

当AI具备了感知和推理能力时，智能体AI（Agentic AI）就应运而生。它的本质是——理解-思考-行动。

当被赋予一个目标时，它会一步步将其分解，能自主调用工具、搜索，执行规划解决问题。

老黄将Agentic AI形象地比做数字世界的「机器人」。

AI的下一个前沿，便是物理AI（Physical AI）。

这种AI不仅能理解数据，还能理解物理世界的规则，比如惯性、摩擦、因果关系等等。

老黄举例称，一个简单的提示，物理AI可生成不同场景的视频以训练自动驾驶汽车。

以上所有的AI技术进步，将促成通用机器人到来，将会打开价值万亿美元的蓝海市场。

值得一提的是，老黄还官宣了开源了NVIDIA Isaac GR00T N1.5，一个更新后的人形机器人推理和技能模型。

此外，由GR00T-Dreams蓝图生成的合成数据，在短短36小时之内被用来开发出GR00T N1.5。

老黄表示，「如果没有蓝图，这将花费三个月的时间」。

参考资料：

https://youtu.be/TLzna9__DnI

人工智能英伟达人形机器大模型性能芯片 CEO 人形机器人算力 AI AI技术

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

刚刚，老黄官宣在中国台北建AI超算！

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。