

新智元报谈
剪辑:倾倾
【新智元导读】vibe coding这个词,是一年前Karpathy造的,当今他我方不必了。110次实验,AI Agent自主跑完,全程没碰键盘,顺带还搭了套家庭监控分析系统。Box CEO Levie看完说了一句话:巨匠不会肃清,但巨匠能作念到的事,规模变了。
昨年2月,Karpathy唾手发文,「vibe coding」爆火。
码农们为这个词吵了好几个月。
一年后,他我方把它「杀」了。
本年3月,他连发多条推文,陈说了一件刚发生的事:AI Agent登录职业器、成立SSH密钥、下载模子、跑基准测试、搭Web UI、写竣工论述。
全程30分钟,他一排代码没写,何况不在场。
vibe coding没出错,仅仅它太慢了。

Karpathy在就寝,AI 依然作念收场110轮实验
Karpathy最近开源了一个叫autoresearch的名目,逻辑很通俗:给AI Agent一个实在的LLM检会环境,让它在你就寝时我方跑实验。

代码传送门:https://github.com/karpathy/autoresearch
Agent修改代码、检会5分钟、查验效劳、保留或丢弃,周而复始,不需要东谈主盯着。
名目里有一段线路,戏谑但肃穆:
有一天,前沿AI参议也曾是由身材诡计机在吃饭、就寝、文娱的轻佻完成的,偶尔通过声波互联契约——也便是组会——进行同步。阿谁期间早已以前。
效劳是,在以前12小时内,AI Agent对nanochat仓库作念了110次修改,考据耗损从0.862415降到了0.858039,每小时约12次实验,wall clock时刻不加多。
你睡一觉,它作念收场100轮。
与此同期,他之前展示的家庭监控分析系统,相通交给Agent全程执行:登录职业器、成立权限、下载模子、搭前端、输出论述。
整个经由约30分钟。半途遭遇报错,Agent我方搜索惩处有盘算,我方修好,不时往下走,不需要他介入。
nanochat本人也在快速进化。相通范畴的GPT-2量级模子,8xH100节点检会时刻从一个月前的约3小时压到了2小时。
Karpathy临了定了一个新盘算:
实在的基准测试应该是——什么样的参议机构Agent代码能最快让nanochat止境?
这才是新的游戏顺序。

从「忘掉代码」到「不碰代码」,一年走了多远?
Karpathy是一个迂曲的「标本」。因为他每一次默契蜕变,齐会公开写下来。
昨年2月,vibe coding是他的个东谈主消遣实验,他说那适合throwaway weekend projects,开云不建议用在正经名目上。
同庚12月,他发了另一条推文:
我从未如斯热烈地感到我方看成措施员逾期了。
并说以前几周内他的职责流发生了20年来最大的变化:从80%手写+20%Agent,翻转成80%Agent+20%修改润色。
他用了一个譬如:
就像你手抓AI在对准,它在辐射弹药。无意会走火,但偶尔在你找到正确角度时,整个强力激光束蓦地射出,一会儿惩处问题。
到了2026年2月,他给vibe coding作念了1周年回想,肃穆建议新词:agentic engineering。
agentic,因为新的默许模式是你99%的时刻不在平直写代码,你在编排Agents并充任监督者;engineering,强调这其中有艺术与科学,有值得深耕的专科性。
两个词齐灵验意。agentic,新的默许模式是你99%的时刻不在平直写代码,你在编排Agent、充任监督者。
engineering,这其中有艺术与科学,有值得深耕的专科性。
Box CEO Aaron Levie在Karpathy的推文下恢复,说了一件和直观相悖的事:深度本领专长不会被稀释,而是被乘上了更大的杠杆。

Karpathy对此的回答印证了这个判断。有东谈主问他,几百东谈主的团队会不会被几个会领导词的东谈主替代?他说:
Vibe coder当今照实能作念到一些事,但在顶层,深度本领专长可能比以前更是一个乘数,因为加了更多杠杆。
器具变了,但谁用得好,取决于你对这件事相识有多深。
咱们再也认不出编程的时势
这不是夸张。
本年1月,Karpathy发了另一条推文,说我方用Claude写代码时有一种的奇异嗅觉:
写了20年代码,从莫得这种嗅觉。它也曾是炫耀感和高智识的泉源,蓦地变得免费和即时——这特殊令东谈主迷失。
一分彩APP官方网站下载他说那有点像在舞弊,舞弊的嗅觉是实在的,不适亦然实在的。
他给这种表象起了个名字:slopacolypse——指多量AI生成的低质料代码倾盆而至、难以区别的时势。他说他正在「迟缓萎缩手动写代码的才调」。
数字在印证这个感受。Y Combinator 2025年冬季批次的初创公司,25%的代码库95%以上由AI生成。
Karpathy对推理老本的判断是每8周减半,从2024到2026年莫得放缓。
当AI Agent处理越来越多的执行职责,懂得何如建议正确问题、考据正确效劳、在正确节点介入——这个才调造成了稀缺金钱。
这是分化的预言——会用杠杆的东谈主,和不会用杠杆的东谈主,正在以加快度分开。
Karpathy的autoresearch名目里有一个细节。
当你让Agent运转跑实验,它只可修改train.py这一个文献,其余全部锁定。
适度Agent的举止范围,保抓diff可审查,确保东谈主能读懂它在作念什么。
一个东谈主设定了AI Agent的规模,然后去洗桑拿了。
这也许是当下最准确的工程师画像。
参考贵府:
https://x.com/karpathy/status/2030722108322717778?s=20
https://x.com/levie/status/2030714592238956960

备案号: