Andrej Karpathy 的軟體革命宣言
本文深入解析 Andrej Karpathy 在 Sequoia AI Ascent 2026 的完整演講。Karpathy 提出 Software 3.0 範式——LLM 不是更快的工具,而是一種全新的電腦,程式設計從「寫程式碼」轉變為「寫上下文」。他以 Menu Gen 應用被一句 Gemini 提示詞取代的親身經歷,證明整個應用層可能不需要存在。他區分了 Vibe Coding(抬升地板,讓所有人都能寫程式)與 Agentic Engineering(拉高天花板,讓專業工程師 10 倍以上加速),並提出「可驗證性框架」解釋為什麼 AI 在數學和程式碼領域飛速進步,卻會叫你走路去 50 公尺外的洗車場。最深刻的洞見:理解力無法外包,這是人類在 AI 時代的最後壁壘。
要理解 Karpathy 在說什麼,你需要先理解軟體的三次根本性轉變。這不是版本升級,而是計算範式的本質改變。
從 1950 年代到今天依然佔主導地位。工程師用 C、Python、Java 等語言,一行一行寫出精確的指令。電腦嚴格執行,沒有任何「理解」。你要它做什麼,你必須精確地告訴它每一步該怎麼做。
Karpathy 在 2017 年提出這個概念。核心轉變:程式設計不再是寫程式碼,而是整理數據集和設計訓練目標。你不告訴電腦怎麼識別貓,你給它 100 萬張貓的照片,讓神經網路自己學會。程式設計師變成了數據策展人和神經網路架構師。
這是 2025-2026 年正在發生的事。Karpathy 在演講中說得很直白:
他用 OpenClaw(一個 AI 編程工具)的安裝流程舉例:傳統思維下,你會期望一個 shell script 來安裝它。但 shell script 在面對不同平台、不同電腦配置時會變得極其複雜。而在 Software 3.0 範式下,安裝方式變成了一段文字描述,你把它複製貼上給你的 AI agent,agent 會根據你的環境、你的電腦,智能地執行安裝、調試錯誤、直到一切正常運作。
三個時代的核心差異不是速度,而是抽象層級的躍遷。
每一次躍遷,人類需要控制的細節減少一個數量級,但需要的判斷力和理解力卻增加一個數量級。
Karpathy 分享了一個讓他自己都震驚的例子。他花了大量時間 vibe coding 出一個叫 Menu Gen 的應用程式——拍餐廳菜單照片,OCR 辨識菜名,用圖像生成器產生每道菜的圖片,部署在 Vercel 上。一個完整的 Software 1.0 + 2.0 混合體。
然後他看到了 Software 3.0 版本:直接把菜單照片丟給 Gemini,一句話指令,AI 就在原始照片上渲染出每道菜的圖片。不需要應用程式,不需要後端,不需要部署。
Software 3.0 不是讓你更快地寫程式,而是讓某些程式根本不需要存在。這對所有 SaaS 創業者是一個生存級別的警告:你的應用程式是否只是在兩個 LLM 能力之間做膠水?如果是,你的護城河就是零。
Karpathy 在 2025 年初創造了「Vibe Coding」這個詞,而到了 2026 年的 Sequoia 舞台上,他回顧了這個概念的演進。
他描述自己的親身經歷:2025 年 12 月是一個明確的轉折點。在此之前,AI 編程工具寫的程式碼「有時候會出錯,你得修改」。但到了 12 月,搭配最新的模型,「程式碼就是正確的,我繼續要求更多,它繼續正確,我想不起來上次修正是什麼時候了」。
然後他就開始 vibe coding 了——全場笑聲。
關鍵詞:地板。Vibe coding 讓完全不懂程式設計的人也能創造軟體應用。一個行銷人員可以做出一個數據儀表板;一個設計師可以做出一個互動原型;一個退休教師可以做出一個個人知識庫。這是民主化,是普及,是地板的整體抬升。
但 Karpathy 話鋒一轉,指出 vibe coding 也有其黑暗面:
Vibe Coding 解放了「做」的門檻,但並沒有降低「做好」的門檻。任何人都能用 AI 寫出一個能跑的網站,但要寫出一個安全、高效、可維護的系統,依然需要深厚的工程理解。這就是為什麼需要 Agentic Engineering。
如果 Vibe Coding 是抬升地板,那 Agentic Engineering 就是拉高天花板。Karpathy 明確區分了這兩者:
軟體業長期有「10x 工程師」的說法——頂尖工程師的生產力是普通工程師的 10 倍。Karpathy 認為在 agentic 時代,這個差距被進一步放大:
Karpathy 描述了他心目中的 agentic engineer:
Karpathy 直言,大多數公司的招聘流程還停留在舊範式:
能力差距的新維度。在 agentic 時代,工程師之間的差距不再是「寫程式碼的速度」,而是「指揮 AI 的能力」。同樣使用 Claude Code,一個人可能只是讓 AI 寫單一函數,另一個人可能同時指揮 15 條並行工作流完成整個系統。後者的生產力可能是前者的 100 倍。這對公司的組織設計、薪資結構、績效評估都是根本性的挑戰。
這是 Karpathy 演講中最具分析深度的部分。他提出了一個簡潔而強大的框架來理解 AI 能力的不均勻分布:
傳統電腦能輕鬆自動化「你能用程式碼指定的事」。LLM 能輕鬆自動化「你能驗證輸出的事」。
自動化速度 = f(可驗證性 + 實驗室關注度)
Karpathy 用了一個讓全場爆笑的例子:
為什麼會這樣?Karpathy 的解釋是雙重因素:
前沿實驗室在訓練 LLM 時,本質上是在做大規模強化學習(RL)。RL 需要「驗證獎勵」——你做對了,得到正回饋;做錯了,得到負回饋。在程式碼領域,驗證是天然的:測試通過就是對,編譯失敗就是錯。在數學領域也一樣:答案對就是對,錯就是錯。
但「50 公尺外的洗車場該開車還是走路」?怎麼驗證?沒有測試可以跑,沒有明確的對錯——只有常識。而常識恰恰不在 RL 的訓練分布中。
Karpathy 揭示了一個重要但少有人討論的事實:AI 的能力分布不只取決於技術,還取決於實驗室選擇關注什麼。他舉了 GPT-3.5 到 GPT-4 西洋棋能力大幅提升的例子——不是因為模型整體變強了,而是因為「有人在 OpenAI 決定把大量西洋棋數據加入預訓練集」。
| 領域 | 可驗證性 | AI 自動化速度 | 原因 |
|---|---|---|---|
| 程式碼 | 極高 | 極快 | 測試通過 / 編譯成功 |
| 數學證明 | 極高 | 極快 | 形式化驗證 |
| 法律文件 | 中高 | 快 | 判例、法規可交叉驗證 |
| 寫作 | 中 | 中 | 可用 LLM 評審團,但主觀性高 |
| 設計美學 | 低 | 慢 | 沒有美學的 RL 獎勵函數 |
| 常識判斷 | 極低 | 極慢 | 「走 50 公尺去洗車」無法驗證 |
如果你能為你的領域創造可驗證的 RL 環境,你就擁有了一個技術槓桿。即使前沿實驗室沒有關注你的領域,你也可以通過自己的微調(fine-tuning)和 RL 環境,讓 AI 在你的垂直領域達到專家水準。Karpathy 暗示他知道這樣的機會存在,但不願在台上透露具體是什麼——「我不想 vague post」,但全場都笑了。
Karpathy 的演講主要是概念框架層面的,但在同一場 Sequoia AI Ascent 2026 會議上,Claude Code 的創造者 Boris Cherny 的實踐案例完美地印證了 Karpathy 的理論。
Boris Cherny 在會議上分享了他如何使用 Claude Code 工作:一個工程師同時指揮 10 到 15 條並行的 AI 工作流。這不是理論,而是每天的實際工作狀態。
Karpathy 和 Cherny 的實踐都指向同一個結論:context(上下文)是 Software 3.0 時代的程式碼。
過去,工程師投資時間在精通一門程式語言的語法和框架。現在,最高回報的投資是:
Karpathy 甚至說,他在使用第三方函式庫時最大的挫折不是程式碼複雜,而是「文件還是寫給人看的」:
當文件的目標讀者從「人類開發者」變成「AI agent」時,整個開發者工具鏈都需要重寫。這對 DevTools 生態系是一個萬億級別的重建機會——從 CLI 到 API 文件到部署流程,一切都要變成「agent-native」。
整場演講最深刻的一刻,發生在最後關於教育的問題。主持人問:當智能變得便宜,什麼還值得深入學習?
Karpathy 引用了一條讓他「每隔一天就會想一次」的推文:
然後他展開了深入的解釋:
這不是文字遊戲。Karpathy 區分了兩種認知活動:
Karpathy 還討論了他寫過的一篇文章——「我們不是在培育動物,我們是在召喚幽靈」。動物(生物智能)是由演化塑造的——有好奇心、有動機、有生存本能。AI(幽靈智能)是由數據和獎勵函數塑造的——沒有內在動機,沒有好奇心,沒有同理心。
他坦承這個框架「可能只是在哲學化」,但核心信息很實際:不要把 AI 當動物對待。對它們吼叫不會讓它們工作得更好或更差。它們是統計模擬迴路——預訓練是統計基底,RL 是錐形突起。
理解力是人類在 AI 時代的最後壁壘,因為理解力不可驗證。
RL 只能改善可驗證的能力。理解——什麼是美、什麼值得做、什麼是對的方向——沒有簡單的驗證函數。這正是 Karpathy 可驗證性框架的終極推論:AI 改善最快的地方,恰恰是人類最不需要的地方(因為 AI 已經夠好了);AI 改善最慢的地方,恰恰是人類最被需要的地方。
古騰堡印刷機讓抄寫員失業。但它沒有取代作者——它取代的是複製內容的人,而不是創造內容的人。作者的價值反而因為分發成本降低而暴增。
VisiCalc 和 Lotus 1-2-3 消滅了大量會計文書工作。但 CFO 的需求不減反增——因為當計算變得瞬間完成,決策的價值就凸顯了。
電腦輔助設計取代了手工繪圖員。建築師沒有消失——他們的設計能力被放大了 10 倍。消失的是「把設計師的草圖轉成精確圖紙」的人。
柯達在 2012 年破產。膠卷沖洗師、暗房技師全部消失。但攝影師不但沒消失,還因為 Instagram 等平台而迎來黃金時代。消失的是介質,不是眼光。
AI 正在取代「寫程式碼的人」。但就像每一次工具革命——消失的是執行層,留下的是理解層。
每次工具革命的公式都一樣:執行成本→趨近於零,判斷價值→趨近於無限。在印刷時代,判斷是「寫什麼」;在電子表格時代,判斷是「算出來之後怎麼決策」;在 Software 3.0 時代,判斷是「讓 AI 做什麼」以及「AI 做出來的東西是否正確、是否值得」。Karpathy 的「理解不能外包」,就是這個歷史規律在 AI 時代的最新表達。
如果一個 agentic engineer 的生產力超過 10 倍,那一個 5 人的 agentic 團隊可能等同於過去 50-100 人的團隊。這不是遙遠的未來——Boris Cherny 已經在日常實踐。企業主需要問自己:我需要的是 50 個 coder,還是 5 個 agentic engineer?
Karpathy 明確說了:出小題目考演算法是舊範式。新的招聘應該是:給大型專案,看候選人如何指揮 AI 完成。評估維度從「你能不能解這個問題」變成「你能不能指揮 AI 解出安全、高效、可維護的方案」。核心考察的是判斷力、品味、和系統設計能力——不是背 API 的能力。
Menu Gen 悖論對每個 SaaS 創辦人都是當頭棒喝。問自己:我的產品是否只是兩個 AI 能力之間的膠水?如果 AI 可以直接從輸入到輸出,你中間那層應用就沒有存在的必要。真正的護城河是:
Karpathy 的願景很清晰:未來所有的文件、API、工具都應該是「agent-first」——先為 AI 設計,再為人類設計。這是一個巨大的基礎設施重建機會。Karpathy 的理想是:「給 LLM 一個 prompt,說『建造 Menu Gen』,然後我不需要碰任何東西,它就部署到網路上了。」離這個理想還很遠,但方向已經確定。
如果 Karpathy 的判斷正確——「一切最終都可以被自動化」——那對企業主來說,窗口期就是 AI 還不擅長你的領域的這段時間。利用這段時間:
Karpathy 的演講不是預言,而是描述。他描述的不是「將來可能發生什麼」,而是「已經在發生什麼」。
讓我們回顧他在這場演講中畫出的清晰圖景:
最後,Karpathy 在離開舞台前的最後幾秒鐘,給出了他對教育的看法——那些增強理解力的工具,才是最有趣、最令人興奮的方向。他自己的 LLM 知識庫專案就是這個方向的實踐:不是讓 AI 代替你理解,而是讓 AI 幫你從不同角度「投射」資訊,讓你獲得更深的洞見。
在 Software 3.0 時代,贏家公式已經改變。
舊公式:最好的工程師 + 最好的程式碼 = 贏
新公式:最深的理解 + 最好的 AI 指揮能力 + 最強的可驗證性設計 = 贏
Karpathy 沒有說程式設計師會消失。他說的是:「寫程式碼」這個動作會消失,但「理解系統」這個能力會變得比以往任何時候都更有價值。
你可以外包你的思考。但你無法外包你的理解。
那你今天,理解了什麼?
系列主題:AGI 不是未來,是現在——而你只有 18 個月的窗口。