有点伤自尊,但太值了!Karpathy:当AI接管80%代码,我看清了AGI魔法

浏览31次 点赞0次 收藏0次

【导读】在2025年的最后一个月,Andrej Karpathy经历了20年编程生涯中「最伤自尊」的一次巨变。

就在刚刚过去的一两个月,一场无声的巨变发生在特斯拉前AI负责人、OpenAI创始成员Andrej Karpathy身上。

去年11月,他的工作流还是80%的代码手敲,20%的代码交给AI。

仅仅几周过去,二八比例,出现了180度对调!

AI接管了80%的代码工作,而他只负责剩下的20%象征性微调工作。

用Karpathy的话说:我现在基本上是在用英语编程,虽然有时多少会觉得有点伤自尊,但那感觉还是太值了。


当大众对AI编码的认知还停留在「AI写代码会有Bug」的阶段时,Karpathy已经宣布,「最热门的新编程语言是英语」!


他抛弃了曾引以为傲的手写代码技能,取而代之的是「用英语指挥AI写代码」的新编程方式。

Karpathy在推文中说道,这是他二十年编程生涯里所出现的,对基础编码工作流最大的变化,而且这些变化还是在短短几周内发生的:

我预计已经有两位数百分比的工程师正在经历类似的转变,而普通大众对此的认知程度,感觉还停留在个位数的低水平。

这说明这场史诗级的AI编码方式转变,并不只是天才程序员的游戏,也发生在许多普通程序员甚至是非编码工程师的人身上。

几乎所有人都在这场Claude引发的狂潮中,感受到了一种职业生涯被重塑的强大冲刷感。

当编程变成一种「不好意思」的对话

Karpathy在描述这段剧变时,用词非常微妙。

他说,现在的编程过程有时会让他感到有一点「伤自尊」。

原本需要一个团队忙活一个星期的架构,现在只要他用英语和AI聊几句,代码就会如潮水般涌现。

也许在去年11月之前,他觉得AI是他的副驾驶,80%的工作还要靠自己手敲代码。

但到了12月,短短几周时间他却突然发现,AI已经接管了驾驶位,他坐在了副驾驶位置,留给他的只有20%的修补工作。

这种「身份互换」所带来的冲击是前所未有的。有着资深编码经历的他,甚至会为这种「不劳而获」的爽感,觉得「有些不好意思」。

但这种转变已经是不可逆转。

尤其是像Claude和Codex等模型的编程能力在去年12月左右经跨过了「一致性」阈值之后,引发了软件工程巨变。

当对话的质量(提示词工程)决定代码的质量,这种「英语编程」就成了一种新的硬核技能。

IDE / 智能体蜂群 / 易错性:一些言过其实的说法

在这篇推文中,Karpathy也谈到了他对当前生成式AI在编程中的作用和局限性的看法。

他觉得有些说法太夸张了,比如「AI来了,就不用IDE(集成开发环境,像VS Code那种代码编辑器)了」,或者「智能体蜂群」(AI智能体像蜂群一样协作编程)的热炒。

他承认AI是巨大进步,但模型还是容易出错,不是万能的。

1.别太相信AI,重要的代码还要自己盯紧

对于真正重要的代码,Karpathy建议不要扔掉IDE,而是用一个大屏、舒服的IDE在旁边监视AI的输出,就像老鹰盯准猎物一样。

现在错误的类型已经明显变了,不再是简单的语法错误,而更类似于一种稍微有点马虎、赶进度的初级工程师会犯的概念性错误。

2.AI最常见的毛病:爱乱假设,然后一路错下去

AI会自己「脑补」一些错误的假设(比如误解你的需求),然后不检查就继续写代码,导致整个东西崩盘。

它不像真人那样停下来问:「这个地方我不确定,你能澄清吗?」,也不会指出代码里的矛盾、比较不同方案的优缺点,或者在你想法不对时「顶撞」你。

相反,依然有点过度讨好。Karpathy认为进入「计划模式」(plan mode,让AI先规划再执行)会好点,但还需要一种更简单、能随时插入的轻量版计划模式。

3.AI爱把简单的事搞复杂

AI写代码时,容易过度抽象(加太多层级)、结构臃肿(代码变胖),还经常不清理自己留下的死代码(废弃的部分)。

它可能给你吐出一大堆低效、容易出bug的上千行代码,当你要求它们简化时,它们可能立刻精简到100行。

它有时还会「多管闲事」,即便和当前任务无关,它们也会顺手修改或删除自己不喜欢、或者没完全理解的注释和代码。

即便在CLAUDE.md里用一些简单指令试图约束,这些问题依然存在。

尽管如此,Karpathy仍认为整体上它已经是革命性提升了,已经很难想象再回到纯手写编码的时代了。

当一个人习惯了AI帮忙写代码,再回去纯手工敲,可能会感觉像是回到了石器时代,超级难受。

这说明AI虽然强大,但人类要聪明使用,才能发挥出超能力的效果。

AGI魔法真相

提速之外

是能力边界的扩展

AI辅助,到底为编程带来了多大的「加速」,这一点虽然并不好量化,但Karpathy的感受是:自己完成原本计划做的事情明显更快了。

而且,还有比这更重要的变化,他可以做远超原计划的事情:

  • 可以写很多以前根本不值得花时间写的代码;

  • 可以去处理以前因为知识或技能不足而完全不敢碰的代码。

因此,除了提速之外,AI编码带给Karpathy更重要的一个变化是能力边界的扩张。

AI韧性

真正的魔法来自于「闭环尝试」

AI智能体之所以能让Karpathy这样的大神感到震撼,是因为它具备一种人类极度稀缺的特质:韧性(Tenacity)。

Karpathy观察到,当一个代码Bug困扰人类超过30分钟,大多数人会陷入烦躁、焦虑甚至想要放弃。

但AI不会。

它会像一台不知疲倦的复读机,为了一个逻辑漏洞死磕到底,它可以连续尝试50种方案,每一次都保持着最初的热情。

耐力本身是人类工作的一个核心瓶颈,而有了大模型之后,这个瓶颈被极大地放宽了。

因此,当很多人认为AI的强大在于它「无所不知」,Karpathy指出,它的真正魔法来自于「闭环尝试」。

大模型非常擅长在循环中不断尝试,直到满足明确的目标条件,Karpathy认为这正是大多数「AGI 体感」魔法的来源。

人类的局限是,我们在写代码时,一旦遇到错误,心智负担会迅速增加。

但AI的优势在于它不知疲倦。如果你给它一个明确的目标(比如:这个网页必须有一个能工作的登录框),它可以在循环中尝试100次。

这种「不断试错直到成功」的能力,在感官上非常接近人类的智慧(AGI体感)。

声明式指令

给「终点」,不给「路线图」

AI这种「闭环尝试」直至成功的特质,意味着我们要把思维从「命令式」(Imperative)切换到「声明式」(Declarative)。

不要告诉它具体步骤,给它成功标准,然后看它自己跑。

  • 命令式编程(旧思维):告诉AI第一步打开文件,第二步解析字符串,第三步过滤空格……如果其中一步错了,全盘皆错。

  • 声明式编程(新思维):告诉AI「我需要一个能处理这种CSV格式并输出图表的脚本,这是它的规格说明」。

只要你定义清楚了「成功标准」,AI就会利用它的「闭环尝试」能力去撞开每一扇门。

测试驱动(TDD)与工具集成(MCP)

Karpathy还提到了具体的实操策略。

1.先写测试,再过测试

Karpathy认为这是最聪明的做法。

先让AI写一段「验证程序是否正确」的代码(测试用例)。

只要测试没通过,AI就得在循环里一直改代码,测试就是AI的「监考老师」。

2.引入MCP(Model Context Protocol)

比如把浏览器能力集成进循环。

AI写完代码,自动打开浏览器运行,如果发现页面白屏或报错,它会自己看到报错信息,然后回到循环里继续修Bug。

整个过程,人类不需要介入。

3. 杠杆效应:用「AI的时间」换取「人的自由」

所谓杠杆效应,就是让智能体循环得更久。

不要一上来就让AI写最复杂的架构,先让它写一个「虽然笨但一定对」的版本。

有了这个正确的基准,再让它去做性能优化。

这样,每个人的编程成本,变成了写下「规格说明」的那几分钟。而AI可能在后台默默循环、尝试、报错、重启了整整一个小时。

我们每个人的杠杆就在于:你投入的「指令时间」越短,AI运行的「循环时间」越长,你获得的生产力倍率就越高。

AI编程的乐趣与「废用性萎缩」

AI编程带给了Karpathy乐趣,这一点让他事先没想到。

他认为用智能体编程反而比以前更好玩了:

当大量填空式的苦活被拿掉,留下来的更多是创造性的部分,他也更少被卡住(Karpathy认为这种被卡住的体验一点都不好玩)。

而且有了AI之后,Karpathy在面对问题时也变得更有勇气了,因为几乎总能找到一种方式与它并肩作战、向前推进。

Karpathy认为AI编程大概会把工程师分成两类:一类主要喜欢「写代码」,另一类主要喜欢「造东西」。

除了这些乐趣和积极的变化之外,Karpathy也看到了AI编程所带来的一种令人不安的变化。

他提出了一个警示:废用性萎缩

「我已经明显感觉到,自己手写代码的能力在慢慢退化。」

Karpathy认为,当我们习惯了只负责判别、不负责生成(这是人类大脑中两种不同的能力),我们的大脑就像是长期不用、开始退化的肌肉,也就是说人类手动编程的能力正在经历一场不可逆的退化。

这不仅是技能的丧失,更是一种深层的「降级」。

如果有一天AI撤下了它的梯子,那些已经习惯了漂浮在云端、失去攀爬能力的程序员,该怎么办?

Karpathy2026预言

垃圾内容大爆发与人才结构的洗牌

自2022年末ChatGPT问世以来,生成式AI的爆发,已经进入第四个年头。

Karpathy表示,他已经为2026年做好了心理准备,那可能会是GitHub、Substack、arXiv、X/Instagram 乃至几乎所有数字媒体的「垃圾内容大爆发」,也包括一些对AI生产力变革的炒作。

当然,这个过程也会伴随着真实、扎实的进步。

最近他不断思考的几个问题是:

「10X工程师」会发生什么变化?

平均工程师和顶尖工程师之间的生产力差距,会不会被进一步拉大?

在大模型加持下,通才是否会越来越胜过专才?毕竟大模型在补齐细节方面很强,但在宏观战略上没那么强。

未来的大模型编程体验会像什么?像打《星际争霸》?像玩《异星工厂》(Factorio)?还是像演奏音乐?

社会中到底有多少问题,本质上是被数字化知识工作的瓶颈卡住的?

Karpathy提到Claude和Codex等AI智能体能力在2025年12月左右跨过了某个一致性阈值,忽然之间像是明显走在了其他一切前面:无论是集成(工具、知识)、新的组织工作流与流程,还是更广泛的扩散。

因此,他认为2026年将会是一个高能量的年份,整个行业都在消化、吸收这种全新的能力

在这种混乱中,人才的结构将发生一次大规模的洗牌。

那些在宏观策略上有洞察、能够跨领域思考的人,因为拥有了AI这个无所不能的执行工具,他们的生产力将被放大成百上千倍,也许通才的春天可能会到来。

相反,那些只掌握单一领域、只会机械执行的「专才」,将面临残酷的挤压。

更让人扎心的是:AI并没有像人们预想的那样抹平差距。

一种现实可能是,一个顶尖开发者利用AI所爆发出的能量,与普通开发者之间的差距,将远远超出10倍以上。

参考资料:

https://x.com/karpathy/status/2015887154132746653

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。