外媒写了篇DeepSeek深度分析,我看完沉默了5分钟
说实话,我关注DeepSeek挺久了。

但直到前两天,我看到一篇外国人写的这篇分析,才觉得自己之前好像只是在看表面。 不是因为里面有什么特别惊天的爆料,而是因为他把一堆我单独看都觉得奇怪的事,用一条逻辑全部串起来了。
先说那个最让人困惑的问题:DeepSeek到底打算怎么赚钱?
没有编程订阅,没有多模态,没有语音,没有视频。
智谱、月之暗面、MiniMax都在卷to C产品,DeepSeek在干嘛?在开源。把自己最核心的技术,一篇一篇论文往外送。那些准备给他们投100亿美元的投资人,难道真的是在烧钱?
这个外国人的答案是:他们根本不想赚那几亿美元的订阅费。他们盯着的,是一个10万亿美元的中国AI硬件产业,然后从里面切出1万亿给自己。
听起来很大,但他用一个具体数字把这件事落了地。
在100万上下文长度下,DeepSeek V4运行时只需要5.48GB的高带宽显存(HBM)。同样条件下,阿里Qwen3需要89GB,智谱GLM5需要60GB。更关键的是,DeepSeek V4是1.6万亿参数的巨无霸,Qwen3只有2350亿参数——参数量是它将近7倍,显存需求反而只有它的1/16。
这不是小幅优化,这是量级上的碾压。
大家都知道HBM是现在全球最紧缺的东西,英伟达芯片之所以那么贵,很大程度上就是因为它。DeepSeek正在通过MLA、CSA等一系列注意力机制的魔改,把KV缓存压缩到这个程度,意味着你可以直接把缓存转存进普通SSD,不再那么依赖HBM了。缓存价格甚至不到Claude Sonnet 4.6的3%,还能免费保留好几个小时。

这个时候你再想想,谁在做SSD?长江存储。
谁在做低功耗内存LPDDR?长鑫存储。
这两家即将 IPO,它们是DeepSeek这套打法的直接受益者。DeepSeek每压缩一点对HBM的依赖,国产存储的市场空间就大一块。长鑫存储目前在LPDDR速度上仅落后国际顶尖半代,差距已经很小了。
还有Engram模块——用LPDDR做哈希查找,代替GPU跑一轮前向传播。查内存比算一遍便宜太多,大规模部署下这是笔极划算的买卖,完美契合国内正在大规模量产的LPDDR。
再有TileLang,一种让算力内核代码写一次、跑在任何硬件上的开源编程语言。意义是绕开英伟达苦心经营二十年的CUDA护城河,让国产GPU和ASIC也能跑最顶级的AI工作负载。DeepSeek甚至在技术文档里直接告诉国内ASIC厂商:你们的芯片应该这样设计,才能把硅片资源用到极致。
这已经不是一家AI公司在优化自己的模型了。这是在给整个硬件生态写操作手册了。
然后是整篇文章里最让我停下来的那个细节。

研究投资的一定知道,OpenAI之前跟AMD签过一种协议:我帮你用芯片、帮你证明你的芯片能跑最顶级的AI工作负载,你给我股票认股权证,随着采购量达到里程碑逐步解锁。AMD直接给了OpenAI 1.6亿股权证,第一阶段在算力部署达到1吉瓦时解锁,后续随采购规模扩大至6吉瓦继续兑现。
这个分析师的判断是:DeepSeek正在和国内的存储、ASIC、CPU、网络芯片厂商谈一模一样的协议。
我看到这里,重新理解了DeepSeek一直在开源这件事。
DeepSeek开源这件事本身,已经在发生效果了。智谱用上了MLA和DSA,Kimi承认自家架构基于DeepSeek演进。你的技术被越多人跑起来,你在谈任何形式的利益绑定时就越有筹码,不一定非得是股权这一种形式。
DeepSeek开源的每一行代码,都是在给未来的议价能力铺路。

西方AI相关股票总市值早就超过10万亿了。如果DeepSeek能在中国复制出同等体量的硬件产业,再用某种利益绑定的方式切进去,1万亿市值不是梦。
也许你会觉得这是老外捧杀,你可能低估了这套逻辑的内在一致性。
或许你会觉得老外想多了,可你认真看那些技术细节——TileLang、Engram、CSA,每一个单独看都是在解同一道题:怎么让国产硬件也能跑起来。
梁文锋是量化出身,詹姆斯·西蒙斯的粉丝。分析师认为他在等一个更大的猎物。
我没想到,把这件事说清楚的,是一个外国人。
有时候真的只有 旁观者才 看得更清楚?
有时候,真的需要一个外国人,才能把一件发生在眼皮底下的事说清楚。哪怕他说的不是全对,但他提的问题,值得认真想一想。你说呢?
声明:本文转载自芯片半导体解析,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!
AI 中文社