有点伤自尊，但太值了！Karpathy：当AI接管80%代码，我看清了AGI魔法

2026-04-01 发布浏览31次点赞0次收藏0次

【导读】在2025年的最后一个月，Andrej Karpathy经历了20年编程生涯中「最伤自尊」的一次巨变。

就在刚刚过去的一两个月，一场无声的巨变发生在特斯拉前AI负责人、OpenAI创始成员Andrej Karpathy身上。

去年11月，他的工作流还是80%的代码手敲，20%的代码交给AI。

仅仅几周过去，二八比例，出现了180度对调！

AI接管了80%的代码工作，而他只负责剩下的20%象征性微调工作。

用Karpathy的话说：我现在基本上是在用英语编程，虽然有时多少会觉得有点伤自尊，但那感觉还是太值了。

当大众对AI编码的认知还停留在「AI写代码会有Bug」的阶段时，Karpathy已经宣布，「最热门的新编程语言是英语」！

他抛弃了曾引以为傲的手写代码技能，取而代之的是「用英语指挥AI写代码」的新编程方式。

Karpathy在推文中说道，这是他二十年编程生涯里所出现的，对基础编码工作流最大的变化，而且这些变化还是在短短几周内发生的：

我预计已经有两位数百分比的工程师正在经历类似的转变，而普通大众对此的认知程度，感觉还停留在个位数的低水平。

这说明这场史诗级的AI编码方式转变，并不只是天才程序员的游戏，也发生在许多普通程序员甚至是非编码工程师的人身上。

几乎所有人都在这场Claude引发的狂潮中，感受到了一种职业生涯被重塑的强大冲刷感。

当编程变成一种「不好意思」的对话

Karpathy在描述这段剧变时，用词非常微妙。

他说，现在的编程过程有时会让他感到有一点「伤自尊」。

原本需要一个团队忙活一个星期的架构，现在只要他用英语和AI聊几句，代码就会如潮水般涌现。

也许在去年11月之前，他觉得AI是他的副驾驶，80%的工作还要靠自己手敲代码。

但到了12月，短短几周时间他却突然发现，AI已经接管了驾驶位，他坐在了副驾驶位置，留给他的只有20%的修补工作。

这种「身份互换」所带来的冲击是前所未有的。有着资深编码经历的他，甚至会为这种「不劳而获」的爽感，觉得「有些不好意思」。

但这种转变已经是不可逆转。

尤其是像Claude和Codex等模型的编程能力在去年12月左右经跨过了「一致性」阈值之后，引发了软件工程巨变。

当对话的质量（提示词工程）决定代码的质量，这种「英语编程」就成了一种新的硬核技能。

IDE / 智能体蜂群 / 易错性：一些言过其实的说法

在这篇推文中，Karpathy也谈到了他对当前生成式AI在编程中的作用和局限性的看法。

他觉得有些说法太夸张了，比如「AI来了，就不用IDE（集成开发环境，像VS Code那种代码编辑器）了」，或者「智能体蜂群」（AI智能体像蜂群一样协作编程）的热炒。

他承认AI是巨大进步，但模型还是容易出错，不是万能的。

1.别太相信AI，重要的代码还要自己盯紧

对于真正重要的代码，Karpathy建议不要扔掉IDE，而是用一个大屏、舒服的IDE在旁边监视AI的输出，就像老鹰盯准猎物一样。

现在错误的类型已经明显变了，不再是简单的语法错误，而更类似于一种稍微有点马虎、赶进度的初级工程师会犯的概念性错误。

2.AI最常见的毛病：爱乱假设，然后一路错下去

AI会自己「脑补」一些错误的假设（比如误解你的需求），然后不检查就继续写代码，导致整个东西崩盘。

它不像真人那样停下来问：「这个地方我不确定，你能澄清吗？」，也不会指出代码里的矛盾、比较不同方案的优缺点，或者在你想法不对时「顶撞」你。

相反，依然有点过度讨好。Karpathy认为进入「计划模式」（plan mode，让AI先规划再执行）会好点，但还需要一种更简单、能随时插入的轻量版计划模式。

3.AI爱把简单的事搞复杂

AI写代码时，容易过度抽象（加太多层级）、结构臃肿（代码变胖），还经常不清理自己留下的死代码（废弃的部分）。

它可能给你吐出一大堆低效、容易出bug的上千行代码，当你要求它们简化时，它们可能立刻精简到100行。

它有时还会「多管闲事」，即便和当前任务无关，它们也会顺手修改或删除自己不喜欢、或者没完全理解的注释和代码。

即便在CLAUDE.md里用一些简单指令试图约束，这些问题依然存在。

尽管如此，Karpathy仍认为整体上它已经是革命性提升了，已经很难想象再回到纯手写编码的时代了。

当一个人习惯了AI帮忙写代码，再回去纯手工敲，可能会感觉像是回到了石器时代，超级难受。

这说明AI虽然强大，但人类要聪明使用，才能发挥出超能力的效果。

AGI魔法真相

提速之外

是能力边界的扩展

AI辅助，到底为编程带来了多大的「加速」，这一点虽然并不好量化，但Karpathy的感受是：自己完成原本计划做的事情明显更快了。

而且，还有比这更重要的变化，他可以做远超原计划的事情：

可以写很多以前根本不值得花时间写的代码；
可以去处理以前因为知识或技能不足而完全不敢碰的代码。

因此，除了提速之外，AI编码带给Karpathy更重要的一个变化是能力边界的扩张。

AI韧性

真正的魔法来自于「闭环尝试」

AI智能体之所以能让Karpathy这样的大神感到震撼，是因为它具备一种人类极度稀缺的特质：韧性（Tenacity）。

Karpathy观察到，当一个代码Bug困扰人类超过30分钟，大多数人会陷入烦躁、焦虑甚至想要放弃。

但AI不会。

它会像一台不知疲倦的复读机，为了一个逻辑漏洞死磕到底，它可以连续尝试50种方案，每一次都保持着最初的热情。

耐力本身是人类工作的一个核心瓶颈，而有了大模型之后，这个瓶颈被极大地放宽了。

因此，当很多人认为AI的强大在于它「无所不知」，Karpathy指出，它的真正魔法来自于「闭环尝试」。

大模型非常擅长在循环中不断尝试，直到满足明确的目标条件，Karpathy认为这正是大多数「AGI 体感」魔法的来源。

人类的局限是，我们在写代码时，一旦遇到错误，心智负担会迅速增加。

但AI的优势在于它不知疲倦。如果你给它一个明确的目标（比如：这个网页必须有一个能工作的登录框），它可以在循环中尝试100次。

这种「不断试错直到成功」的能力，在感官上非常接近人类的智慧（AGI体感）。

声明式指令

给「终点」，不给「路线图」

AI这种「闭环尝试」直至成功的特质，意味着我们要把思维从「命令式」（Imperative）切换到「声明式」（Declarative）。

不要告诉它具体步骤，给它成功标准，然后看它自己跑。

命令式编程（旧思维）：告诉AI第一步打开文件，第二步解析字符串，第三步过滤空格……如果其中一步错了，全盘皆错。
声明式编程（新思维）：告诉AI「我需要一个能处理这种CSV格式并输出图表的脚本，这是它的规格说明」。

只要你定义清楚了「成功标准」，AI就会利用它的「闭环尝试」能力去撞开每一扇门。

测试驱动（TDD）与工具集成（MCP）

Karpathy还提到了具体的实操策略。

1.先写测试，再过测试

Karpathy认为这是最聪明的做法。

先让AI写一段「验证程序是否正确」的代码（测试用例）。

只要测试没通过，AI就得在循环里一直改代码，测试就是AI的「监考老师」。

2.引入MCP（Model Context Protocol）

比如把浏览器能力集成进循环。

AI写完代码，自动打开浏览器运行，如果发现页面白屏或报错，它会自己看到报错信息，然后回到循环里继续修Bug。

整个过程，人类不需要介入。

3. 杠杆效应：用「AI的时间」换取「人的自由」

所谓杠杆效应，就是让智能体循环得更久。

不要一上来就让AI写最复杂的架构，先让它写一个「虽然笨但一定对」的版本。

有了这个正确的基准，再让它去做性能优化。

这样，每个人的编程成本，变成了写下「规格说明」的那几分钟。而AI可能在后台默默循环、尝试、报错、重启了整整一个小时。

我们每个人的杠杆就在于：你投入的「指令时间」越短，AI运行的「循环时间」越长，你获得的生产力倍率就越高。

AI编程的乐趣与「废用性萎缩」

AI编程带给了Karpathy乐趣，这一点让他事先没想到。

他认为用智能体编程反而比以前更好玩了：

当大量填空式的苦活被拿掉，留下来的更多是创造性的部分，他也更少被卡住（Karpathy认为这种被卡住的体验一点都不好玩）。

而且有了AI之后，Karpathy在面对问题时也变得更有勇气了，因为几乎总能找到一种方式与它并肩作战、向前推进。

Karpathy认为AI编程大概会把工程师分成两类：一类主要喜欢「写代码」，另一类主要喜欢「造东西」。

除了这些乐趣和积极的变化之外，Karpathy也看到了AI编程所带来的一种令人不安的变化。

他提出了一个警示：废用性萎缩。

「我已经明显感觉到，自己手写代码的能力在慢慢退化。」

Karpathy认为，当我们习惯了只负责判别、不负责生成（这是人类大脑中两种不同的能力），我们的大脑就像是长期不用、开始退化的肌肉，也就是说人类手动编程的能力正在经历一场不可逆的退化。

这不仅是技能的丧失，更是一种深层的「降级」。

如果有一天AI撤下了它的梯子，那些已经习惯了漂浮在云端、失去攀爬能力的程序员，该怎么办？

Karpathy2026预言

垃圾内容大爆发与人才结构的洗牌

自2022年末ChatGPT问世以来，生成式AI的爆发，已经进入第四个年头。

Karpathy表示，他已经为2026年做好了心理准备，那可能会是GitHub、Substack、arXiv、X/Instagram 乃至几乎所有数字媒体的「垃圾内容大爆发」，也包括一些对AI生产力变革的炒作。

当然，这个过程也会伴随着真实、扎实的进步。

最近他不断思考的几个问题是：

「10X工程师」会发生什么变化？

平均工程师和顶尖工程师之间的生产力差距，会不会被进一步拉大？

在大模型加持下，通才是否会越来越胜过专才？毕竟大模型在补齐细节方面很强，但在宏观战略上没那么强。

未来的大模型编程体验会像什么？像打《星际争霸》？像玩《异星工厂》（Factorio）？还是像演奏音乐？

社会中到底有多少问题，本质上是被数字化知识工作的瓶颈卡住的？

Karpathy提到Claude和Codex等AI智能体能力在2025年12月左右跨过了某个一致性阈值，忽然之间像是明显走在了其他一切前面：无论是集成（工具、知识）、新的组织工作流与流程，还是更广泛的扩散。

因此，他认为2026年将会是一个高能量的年份，整个行业都在消化、吸收这种全新的能力。

在这种混乱中，人才的结构将发生一次大规模的洗牌。

那些在宏观策略上有洞察、能够跨领域思考的人，因为拥有了AI这个无所不能的执行工具，他们的生产力将被放大成百上千倍，也许通才的春天可能会到来。

相反，那些只掌握单一领域、只会机械执行的「专才」，将面临残酷的挤压。

更让人扎心的是：AI并没有像人们预想的那样抹平差距。

一种现实可能是，一个顶尖开发者利用AI所爆发出的能量，与普通开发者之间的差距，将远远超出10倍以上。

参考资料：

https://x.com/karpathy/status/2015887154132746653

OpenAI AI mod GPT 大模型试用 ChatGPT 性能程序员测试 AGI Claude 特斯拉大神体验 IDE

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。

有点伤自尊，但太值了！Karpathy：当AI接管80%代码，我看清了AGI魔法

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。