OpenAI創(chuàng)始成員、特斯拉前AI總監(jiān)Andrej Karpathy,剛剛分享了他使用Claude進行數周高強度編程后的心得體會。
AK直言,自己的工作流在幾周內就發(fā)生了巨變:從80%手動編碼,轉變?yōu)?0%由AI來寫,這“有點傷自尊”,但這種轉變帶來的巨大效用難以抗拒。他詳細闡述了當前AI編程的優(yōu)缺點、對個人能力的影響,并對行業(yè)的未來提出了疑問

以下是Karpathy的核心觀點:
編碼工作流的顛覆
和許多人一樣,隨著大語言模型編碼能力的提升,AK的工作流也迅速改變。
去年11月,大約是80%手動+自動補全編碼,20%使用智能體。到了12月,這個比例顛倒了過來,變成了80%由智能體編碼,AK只做20%的編輯和修補工作。
也就是說,現在基本上AK是在用英語編程,有點不好意思地用語言告訴大模型要寫什么代碼。這確實有點傷自尊,但通過大型“代碼動作”來操作軟件的力量實在太有用了,尤其是當你適應、配置、學會使用它,并理解了它的能力邊界之后。
這是AK編程近20年來,基礎編碼工作流發(fā)生的最大變化,而且僅僅在幾周之內就完成了。AK預計,在工程師群體中,有兩位數百分比的人正在經歷類似轉變,而普通大眾對此的認知度可能還停留在低個位數百分比。
IDE、智能體群和易錯性
目前,“不再需要IDE”和“智能體集群”這兩種炒作都為時過早。
模型肯定還是會犯錯,如果你有任何真正在意的代碼,AK建議你在旁邊開一個大大的IDE,像鷹一樣盯著它們。
模型的錯誤類型已經變了很多——不再是簡單的語法錯誤,而是那些有點草率、急躁的初級開發(fā)人員可能會犯的、細微的概念性錯誤。最常見的錯誤是,模型會為你做出錯誤的假設,并且不加核實就繼續(xù)執(zhí)行。
它們也無法處理自身的困惑,不會尋求澄清,不會揭示不一致之處,不會展示權衡利弊,不會在應該反駁的時候提出異議,而且仍然有點過于諂媚。在規(guī)劃模式(plan mode)下情況會有所好轉,但我們還需要一種輕量級的內聯規(guī)劃模式。
此外,它們還非常喜歡把代碼和API搞得過于復雜,濫用抽象,也不會清理自己留下的無用代碼。它們會用1000行代碼實現一個低效、臃腫、脆弱的結構,而你得提醒它:“嗯......你難道不能這樣做嗎?”然后它們會說:“當然可以!”并立刻把代碼縮減到100行。它們有時還會更改或刪除自己不喜歡或理解不夠充分的注釋和代碼,即使這與當前任務無關。
盡AK嘗試通過在
CLAUDE.md中給出一些簡單的指令來修復這些問題,但它們依然存在。然而,盡管有這些問題,這仍然是一個巨大的凈提升,很難想象再回到手動編碼的時代。長話短說,AK目前的流程是:左邊開幾個ghostty窗口/標簽頁跑幾個小型的CC會話(與Claude交互),右邊開一個IDE用于查看代碼和手動編輯。
堅韌性
觀察一個智能體不懈地工作是件非常有趣的事。它們從不疲倦,從不泄氣,只是不斷地嘗試,在人類可能早就放棄、改日再戰(zhàn)的地方繼續(xù)堅持。
看著它為一個問題苦苦掙扎很長時間,最終在30分鐘后取得勝利,那一刻有一種“感受到AGI”的瞬間。你意識到,耐力是工作的核心瓶頸之一,而有了大語言模型,這個瓶頸被極大地拓寬了。
效率提升
很難衡量大語言模型輔助帶來的“效率提升”到底有多大。當然,對于原本計劃要做的事情,AK感覺速度快了很多。但主要影響在于,做了遠比原計劃更多的事情,因為:
1. 能編寫出各種以前覺得不值得花時間去寫的東西。
2. 能處理以前因為知識或技能問題而無法著手的代碼。
所以,這當然是效率提升,但更多的是一種“能力擴張”。
杠桿作用
大語言模型異常擅長循環(huán)執(zhí)行任務直到滿足特定目標,這正是大部分“感受到AGI”魔力的來源。
不要告訴它具體怎么做,而是給它成功的標準,然后看它表演。讓它先寫測試,然后再通過這些測試。把它放進一個帶有瀏覽器MCP(模型控制程序)的循環(huán)里。先寫一個很可能正確的樸素算法,然后要求它在保持正確性的前提下進行優(yōu)化。
將你的方法從“命令式”轉變?yōu)椤奥暶魇健?可以讓智能體循環(huán)更長時間,從而獲得更大的杠桿作用。
樂趣
AK沒預料到,在智能體的幫助下,編程變得更有趣了。因為大量“填空式”的苦差事被消除了,剩下的就是創(chuàng)造性的部分。
AK也感覺更少被卡住(這很不愉快),并且體驗到了更多的勇氣,因為幾乎總有辦法能與它攜手取得一些積極進展。
AK也看到了其他人的相反觀點;大語言模型編碼將根據工程師主要是喜歡“編碼”還是喜歡“構建”而將他們區(qū)分開來。
能力萎縮
AK已經注意到,手動編寫代碼的能力正開始慢慢萎縮。
生成(寫代碼)和辨別(讀代碼)是大腦中的兩種不同能力。很大程度上因為編程中涉及的各種細微的、主要是語法上的細節(jié),即使你很難寫出代碼,你也可以很好地審查代碼。
垃圾末日(Slopacolypse)
AK正準備迎接2026年,那將是GitHub、Substack、arXiv、X/Instagram以及所有數字媒體的“垃圾末日”之年。除了實際的、真正的進步之外,我們還會看到更多AI炒作下的“生產力表演”(這還有可能更多嗎?)。
幾個問題
AK腦海中有幾個問題:
“10倍工程師”會怎樣——頂尖工程師與平均水平工程師之間的生產力差距會如何變化?這個比例很有可能大幅增長
有了大語言模型,通才是否會越來越勝過專才?大語言模型在“填空”(微觀)方面遠比在“宏大戰(zhàn)略”(宏觀)方面更出色
未來的大語言模型編程會是什么感覺?像玩《星際爭霸》?玩《異星工廠》?還是演奏音樂?
整個社會在多大程度上受限于數字知識工作?
總結
這一切將我們引向何方?
大語言模型智能體(尤其是Claude和Codex)的能力似乎在2025年12月前后跨越了某種“一致性”的門檻,引發(fā)了軟件工程及相關領域的相變。
“智能”部分突然感覺遙遙領先于其他所有部分——包括集成(工具、知識)、對新組織工作流程和流程的需求,以及更廣泛的技術擴散。
隨著整個行業(yè)消化這一新能力,2026年將是充滿能量的一年
source:
https://x.com/karpathy/status/2015883857489522876
本文來源:
484
收藏



















