Sequoia AI Ascent 2026 深度解讀 (2/3)

Software 3.0 — 從 Vibe Coding 到 Agentic Engineering

Andrej Karpathy 的軟體革命宣言

獨立研究｜阿貴研究室｜ 2026-05-02
系列主題：AGI 不是未來，是現在——而你只有 18 個月的窗口

2025 年 12 月，AI 教父級人物 Andrej Karpathy 開始 vibe coding。他不再修正 AI 寫的程式碼，甚至想不起來上次改過什麼。幾個月後，他站上 Sequoia AI Ascent 2026 的舞台，說了一句讓全場安靜的話：

「你可以外包你的思考，但你無法外包你的理解。」

這不是雞湯。這是一個曾經共同創辦 OpenAI、打造 Tesla Autopilot、影響了整個深度學習世代的人，在親身經歷了 AI 編程革命後，給出的最終判斷。這場演講 YouTube 觀看次數突破 3,100 萬，是整場會議最受關注的一場。

摘要

本文深入解析 Andrej Karpathy 在 Sequoia AI Ascent 2026 的完整演講。Karpathy 提出 Software 3.0 範式——LLM 不是更快的工具，而是一種全新的電腦，程式設計從「寫程式碼」轉變為「寫上下文」。他以 Menu Gen 應用被一句 Gemini 提示詞取代的親身經歷，證明整個應用層可能不需要存在。他區分了 Vibe Coding（抬升地板，讓所有人都能寫程式）與 Agentic Engineering（拉高天花板，讓專業工程師 10 倍以上加速），並提出「可驗證性框架」解釋為什麼 AI 在數學和程式碼領域飛速進步，卻會叫你走路去 50 公尺外的洗車場。最深刻的洞見：理解力無法外包，這是人類在 AI 時代的最後壁壘。

Software 3.0 Vibe Coding Agentic Engineering 可驗證性鋸齒狀智能 LLM 即電腦 Context Window Andrej Karpathy Sequoia AI Ascent 幽靈 vs 動物

3,100 萬+

YouTube 觀看次數（會議最高）

3 次

軟體範式革命（1.0 → 2.0 → 3.0）

> 10x

Agentic 工程師的生產力倍增

10-15 條

Boris Cherny 同時指揮的 AI 工作流

Software 1.0 → 2.0 → 3.0：三次軟體革命
Vibe Coding：當寫程式變成寫作文
Agentic Engineering：天花板在哪裡？
可驗證性框架：什麼能交給 AI？什麼不能？
一個工程師指揮 15 條 AI 工作流
「理解不能外包」——Karpathy 的警告
歷史印證：每次工具革命都淘汰了誰？
商業啟發：企業主該怎麼重新定義「工程師」
結論：你站在哪一邊？
系列導讀
參考文獻

一、Software 1.0 → 2.0 → 3.0：三次軟體革命

要理解 Karpathy 在說什麼，你需要先理解軟體的三次根本性轉變。這不是版本升級，而是計算範式的本質改變。

Software 1.0：人類寫規則

從 1950 年代到今天依然佔主導地位。工程師用 C、Python、Java 等語言，一行一行寫出精確的指令。電腦嚴格執行，沒有任何「理解」。你要它做什麼，你必須精確地告訴它每一步該怎麼做。

Software 2.0：機器學整理數據集

Karpathy 在 2017 年提出這個概念。核心轉變：程式設計不再是寫程式碼，而是整理數據集和設計訓練目標。你不告訴電腦怎麼識別貓，你給它 100 萬張貓的照片，讓神經網路自己學會。程式設計師變成了數據策展人和神經網路架構師。

Software 3.0：用自然語言「程式設計」

這是 2025-2026 年正在發生的事。Karpathy 在演講中說得很直白：

「Software 3.0 就是——你的程式設計現在變成了提示詞，而 context window（上下文窗口）就是你對這個解釋器（LLM）的操縱桿。」

— Andrej Karpathy, Sequoia AI Ascent 2026

他用 OpenClaw（一個 AI 編程工具）的安裝流程舉例：傳統思維下，你會期望一個 shell script 來安裝它。但 shell script 在面對不同平台、不同電腦配置時會變得極其複雜。而在 Software 3.0 範式下，安裝方式變成了一段文字描述，你把它複製貼上給你的 AI agent，agent 會根據你的環境、你的電腦，智能地執行安裝、調試錯誤、直到一切正常運作。

第一性原理

三個時代的核心差異不是速度，而是抽象層級的躍遷。

1.0：你指揮機器的每一步（How）
2.0：你定義目標，機器學習方法（What + Data）
3.0：你描述意圖，機器理解並執行（Why + Context）

每一次躍遷，人類需要控制的細節減少一個數量級，但需要的判斷力和理解力卻增加一個數量級。

Menu Gen 悖論：整個應用層可能不需要存在

Karpathy 分享了一個讓他自己都震驚的例子。他花了大量時間 vibe coding 出一個叫 Menu Gen 的應用程式——拍餐廳菜單照片，OCR 辨識菜名，用圖像生成器產生每道菜的圖片，部署在 Vercel 上。一個完整的 Software 1.0 + 2.0 混合體。

然後他看到了 Software 3.0 版本：直接把菜單照片丟給 Gemini，一句話指令，AI 就在原始照片上渲染出每道菜的圖片。不需要應用程式，不需要後端，不需要部署。

「我所有的 Menu Gen 都是多餘的。它在舊範式裡運作——這個 app 根本不應該存在。」

— Andrej Karpathy

核心洞察

Software 3.0 不是讓你更快地寫程式，而是讓某些程式根本不需要存在。這對所有 SaaS 創業者是一個生存級別的警告：你的應用程式是否只是在兩個 LLM 能力之間做膠水？如果是，你的護城河就是零。

二、Vibe Coding：當寫程式變成寫作文

Karpathy 在 2025 年初創造了「Vibe Coding」這個詞，而到了 2026 年的 Sequoia 舞台上，他回顧了這個概念的演進。

他描述自己的親身經歷：2025 年 12 月是一個明確的轉折點。在此之前，AI 編程工具寫的程式碼「有時候會出錯，你得修改」。但到了 12 月，搭配最新的模型，「程式碼就是正確的，我繼續要求更多，它繼續正確，我想不起來上次修正是什麼時候了」。

然後他就開始 vibe coding 了——全場笑聲。

Vibe Coding 的本質是什麼？

「Vibe coding 是關於抬升地板（raising the floor）——讓每個人都能用軟體做事。地板上升了，每個人都能 vibe code 任何東西，這太驚人了。」

— Andrej Karpathy

關鍵詞：地板。Vibe coding 讓完全不懂程式設計的人也能創造軟體應用。一個行銷人員可以做出一個數據儀表板；一個設計師可以做出一個互動原型；一個退休教師可以做出一個個人知識庫。這是民主化，是普及，是地板的整體抬升。

但 Karpathy 話鋒一轉，指出 vibe coding 也有其黑暗面：

安全漏洞——vibe coding 不保證安全性。他的 Menu Gen 就出現了一個經典錯誤：用 email 地址做交叉比對而不是用統一的 user ID，導致使用不同 email 註冊 Google 和 Stripe 的用戶無法匹配付款
程式碼品質——「有時候我看到生成的程式碼會小心臟病發作，因為它不是超棒的程式碼。很臃腫，很多複製貼上，抽象層很脆弱——它能用，但真的很噁心。」
架構判斷缺失——AI 可以寫出能運作的程式碼，但缺乏對底層原理的理解，比如 tensor 的 view 和 storage 的區別、記憶體效率等

關鍵區分

Vibe Coding 解放了「做」的門檻，但並沒有降低「做好」的門檻。任何人都能用 AI 寫出一個能跑的網站，但要寫出一個安全、高效、可維護的系統，依然需要深厚的工程理解。這就是為什麼需要 Agentic Engineering。

三、Agentic Engineering：天花板在哪裡？

如果 Vibe Coding 是抬升地板，那 Agentic Engineering 就是拉高天花板。Karpathy 明確區分了這兩者：

Vibe Coding（地板）

讓所有人都能做軟體
快速原型、個人專案
品質要求較低
「能用就好」

Agentic Engineering（天花板）

專業軟體工程的 AI 加速
品質標準不妥協
不允許引入安全漏洞
「又快又好」

「Agentic engineering 是一門工程學科。你有這些 agents，它們是刺刺的（spiky）實體——有點易出錯、有點隨機，但極其強大。問題是：你如何協調它們加速前進，又不犧牲品質標準？」

— Andrej Karpathy

10x 工程師的迷思已經過時

軟體業長期有「10x 工程師」的說法——頂尖工程師的生產力是普通工程師的 10 倍。Karpathy 認為在 agentic 時代，這個差距被進一步放大：

「人們過去談論 10 倍工程師。我認為這個倍數現在被大幅放大了。10 倍已經不是你能獲得的加速。我看到的是，那些真正擅長這件事的人，超過 10 倍——從我的觀察來看。」

— Andrej Karpathy

Agentic Engineer 長什麼樣？

Karpathy 描述了他心目中的 agentic engineer：

投資於工具設置——就像過去工程師會深度客製化 vim 或 VS Code，現在需要深度客製化 Claude Code、OpenClaw 等 agentic 工具
掌握品味與判斷——「你負責美學、判斷、品味、以及一點點監督」
設計 Spec 而非寫程式碼——與 agent 協作設計詳細的規格書和文件，讓 agent 去實現
理解底層原理——不需要記住 keep_dims vs keep_dim，但必須理解 tensor 的 view 和 storage 概念

招聘也必須改變

Karpathy 直言，大多數公司的招聘流程還停留在舊範式：

「如果你還在出小解謎題（puzzles），那是舊範式。招聘應該變成：給一個大型專案，看候選人如何實現。比如寫一個 Twitter clone，部署上線，然後我用 10 個 AI 去嘗試破解你的系統——它們不應該能成功。」

— Andrej Karpathy

商業啟發

能力差距的新維度。在 agentic 時代，工程師之間的差距不再是「寫程式碼的速度」，而是「指揮 AI 的能力」。同樣使用 Claude Code，一個人可能只是讓 AI 寫單一函數，另一個人可能同時指揮 15 條並行工作流完成整個系統。後者的生產力可能是前者的 100 倍。這對公司的組織設計、薪資結構、績效評估都是根本性的挑戰。

四、可驗證性框架：什麼能交給 AI？什麼不能？

這是 Karpathy 演講中最具分析深度的部分。他提出了一個簡潔而強大的框架來理解 AI 能力的不均勻分布：

Karpathy 可驗證性框架

傳統電腦能輕鬆自動化「你能用程式碼指定的事」。LLM 能輕鬆自動化「你能驗證輸出的事」。

自動化速度 = f（可驗證性 + 實驗室關注度）

為什麼 AI 如此「鋸齒」？

Karpathy 用了一個讓全場爆笑的例子：

「Opus 4.7 能同時重構一個 10 萬行的程式碼庫，或者發現零日漏洞——但它會告訴你走路去 50 公尺外的洗車場。這太瘋狂了。」

— Andrej Karpathy

為什麼會這樣？Karpathy 的解釋是雙重因素：

因素一：可驗證性決定 RL 效果

前沿實驗室在訓練 LLM 時，本質上是在做大規模強化學習（RL）。RL 需要「驗證獎勵」——你做對了，得到正回饋；做錯了，得到負回饋。在程式碼領域，驗證是天然的：測試通過就是對，編譯失敗就是錯。在數學領域也一樣：答案對就是對，錯就是錯。

但「50 公尺外的洗車場該開車還是走路」？怎麼驗證？沒有測試可以跑，沒有明確的對錯——只有常識。而常識恰恰不在 RL 的訓練分布中。

因素二：實驗室的關注度分配

Karpathy 揭示了一個重要但少有人討論的事實：AI 的能力分布不只取決於技術，還取決於實驗室選擇關注什麼。他舉了 GPT-3.5 到 GPT-4 西洋棋能力大幅提升的例子——不是因為模型整體變強了，而是因為「有人在 OpenAI 決定把大量西洋棋數據加入預訓練集」。

「如果你在 RL 的迴路裡，你會飛。如果你在數據分布之外，你會掙扎。你必須搞清楚你的應用在哪個迴路裡。」

— Andrej Karpathy

可驗證性光譜

領域	可驗證性	AI 自動化速度	原因
程式碼	極高	極快	測試通過 / 編譯成功
數學證明	極高	極快	形式化驗證
法律文件	中高	快	判例、法規可交叉驗證
寫作	中	中	可用 LLM 評審團，但主觀性高
設計美學	低	慢	沒有美學的 RL 獎勵函數
常識判斷	極低	極慢	「走 50 公尺去洗車」無法驗證

對創業者的啟示

如果你能為你的領域創造可驗證的 RL 環境，你就擁有了一個技術槓桿。即使前沿實驗室沒有關注你的領域，你也可以通過自己的微調（fine-tuning）和 RL 環境，讓 AI 在你的垂直領域達到專家水準。Karpathy 暗示他知道這樣的機會存在，但不願在台上透露具體是什麼——「我不想 vague post」，但全場都笑了。

五、一個工程師指揮 15 條 AI 工作流

Karpathy 的演講主要是概念框架層面的，但在同一場 Sequoia AI Ascent 2026 會議上，Claude Code 的創造者 Boris Cherny 的實踐案例完美地印證了 Karpathy 的理論。

Boris Cherny 的工作方式

Boris Cherny 在會議上分享了他如何使用 Claude Code 工作：一個工程師同時指揮 10 到 15 條並行的 AI 工作流。這不是理論，而是每天的實際工作狀態。

角色轉變

從「寫程式碼的人」變成「指揮 AI 軍團的指揮官」

核心能力

任務分解、上下文設計、品質控制、並行協調

生產力倍增

一個人完成過去整個團隊的工作量

新瓶頸

人類的理解力和注意力，而非 AI 的計算力

Context 是新的程式設計

Karpathy 和 Cherny 的實踐都指向同一個結論：context（上下文）是 Software 3.0 時代的程式碼。

過去，工程師投資時間在精通一門程式語言的語法和框架。現在，最高回報的投資是：

CLAUDE.md / system prompts——定義 AI 的行為邊界和工作方式
文件和規格書——越詳細的上下文，AI 產出的品質越高
測試套件——可驗證的測試就是最好的「AI 指導」
程式碼庫的組織方式——讓 AI 容易理解的程式碼結構

Karpathy 甚至說，他在使用第三方函式庫時最大的挫折不是程式碼複雜，而是「文件還是寫給人看的」：

「為什麼還有人告訴我該怎麼做？我不想做任何事情。我要的是——能複製貼上給我的 agent 的那段文字是什麼？」

— Andrej Karpathy（全場笑聲）

範式轉換的信號

當文件的目標讀者從「人類開發者」變成「AI agent」時，整個開發者工具鏈都需要重寫。這對 DevTools 生態系是一個萬億級別的重建機會——從 CLI 到 API 文件到部署流程，一切都要變成「agent-native」。

六、「理解不能外包」——Karpathy 的警告

整場演講最深刻的一刻，發生在最後關於教育的問題。主持人問：當智能變得便宜，什麼還值得深入學習？

Karpathy 引用了一條讓他「每隔一天就會想一次」的推文：

「You can outsource your thinking, but you can't outsource your understanding.」
（你可以外包你的思考，但你無法外包你的理解。）

— Andrej Karpathy 引用

然後他展開了深入的解釋：

「我仍然是系統的一部分。資訊仍然必須進入我的大腦。我感覺自己正在變成瓶頸——光是搞清楚我們在建造什麼、為什麼值得做、如何指揮我的 agents⋯⋯你不可能成為一個好的指揮官，如果你自己都不理解正在發生什麼。LLM 確實不擅長理解——那依然是你獨特的職責。」

— Andrej Karpathy

思考 vs. 理解：關鍵區分

這不是文字遊戲。Karpathy 區分了兩種認知活動：

思考（Thinking）——可外包

分析數據
寫程式碼
推導數學
搜尋資訊
產生方案

理解（Understanding）——不可外包

判斷什麼值得做
設定正確的方向
品味與美學
跨領域直覺
指揮 agent 的上下文

幽靈 vs. 動物

Karpathy 還討論了他寫過的一篇文章——「我們不是在培育動物，我們是在召喚幽靈」。動物（生物智能）是由演化塑造的——有好奇心、有動機、有生存本能。AI（幽靈智能）是由數據和獎勵函數塑造的——沒有內在動機，沒有好奇心，沒有同理心。

他坦承這個框架「可能只是在哲學化」，但核心信息很實際：不要把 AI 當動物對待。對它們吼叫不會讓它們工作得更好或更差。它們是統計模擬迴路——預訓練是統計基底，RL 是錐形突起。

深層含義

理解力是人類在 AI 時代的最後壁壘，因為理解力不可驗證。

RL 只能改善可驗證的能力。理解——什麼是美、什麼值得做、什麼是對的方向——沒有簡單的驗證函數。這正是 Karpathy 可驗證性框架的終極推論：AI 改善最快的地方，恰恰是人類最不需要的地方（因為 AI 已經夠好了）；AI 改善最慢的地方，恰恰是人類最被需要的地方。

七、歷史印證：每次工具革命都淘汰了誰？

歷史鏡鑒

1440 年 — 印刷術

古騰堡印刷機讓抄寫員失業。但它沒有取代作者——它取代的是複製內容的人，而不是創造內容的人。作者的價值反而因為分發成本降低而暴增。

1970s — 電子表格

VisiCalc 和 Lotus 1-2-3 消滅了大量會計文書工作。但 CFO 的需求不減反增——因為當計算變得瞬間完成，決策的價值就凸顯了。

1990s — AutoCAD

電腦輔助設計取代了手工繪圖員。建築師沒有消失——他們的設計能力被放大了 10 倍。消失的是「把設計師的草圖轉成精確圖紙」的人。

2000s — 數位攝影

柯達在 2012 年破產。膠卷沖洗師、暗房技師全部消失。但攝影師不但沒消失，還因為 Instagram 等平台而迎來黃金時代。消失的是介質，不是眼光。

2026 — Software 3.0

AI 正在取代「寫程式碼的人」。但就像每一次工具革命——消失的是執行層，留下的是理解層。

歷史規律

每次工具革命的公式都一樣：執行成本→趨近於零，判斷價值→趨近於無限。在印刷時代，判斷是「寫什麼」；在電子表格時代，判斷是「算出來之後怎麼決策」；在 Software 3.0 時代，判斷是「讓 AI 做什麼」以及「AI 做出來的東西是否正確、是否值得」。Karpathy 的「理解不能外包」，就是這個歷史規律在 AI 時代的最新表達。

八、商業啟發：企業主該怎麼重新定義「工程師」

啟發一：工程團隊規模公式要重算

如果一個 agentic engineer 的生產力超過 10 倍，那一個 5 人的 agentic 團隊可能等同於過去 50-100 人的團隊。這不是遙遠的未來——Boris Cherny 已經在日常實踐。企業主需要問自己：我需要的是 50 個 coder，還是 5 個 agentic engineer？

啟發二：招聘標準的革命

Karpathy 明確說了：出小題目考演算法是舊範式。新的招聘應該是：給大型專案，看候選人如何指揮 AI 完成。評估維度從「你能不能解這個問題」變成「你能不能指揮 AI 解出安全、高效、可維護的方案」。核心考察的是判斷力、品味、和系統設計能力——不是背 API 的能力。

啟發三：SaaS 護城河重新評估

Menu Gen 悖論對每個 SaaS 創辦人都是當頭棒喝。問自己：我的產品是否只是兩個 AI 能力之間的膠水？如果 AI 可以直接從輸入到輸出，你中間那層應用就沒有存在的必要。真正的護城河是：

獨有的數據——AI 訓練集裡沒有的數據
獨有的驗證環境——你能為你的垂直領域創造 RL 環境
工作流整合——不只是一次性的輸入輸出，而是嵌入企業流程
信任與合規——醫療、法律、金融等需要責任歸屬的領域

啟發四：投資於「agent-native」基礎設施

Karpathy 的願景很清晰：未來所有的文件、API、工具都應該是「agent-first」——先為 AI 設計，再為人類設計。這是一個巨大的基礎設施重建機會。Karpathy 的理想是：「給 LLM 一個 prompt，說『建造 Menu Gen』，然後我不需要碰任何東西，它就部署到網路上了。」離這個理想還很遠，但方向已經確定。

啟發五：18 個月窗口期

如果 Karpathy 的判斷正確——「一切最終都可以被自動化」——那對企業主來說，窗口期就是 AI 還不擅長你的領域的這段時間。利用這段時間：

建立你的垂直領域 RL 環境和專有數據
把團隊從「寫程式碼」轉型為「指揮 AI」
把文件和工具鏈改造為 agent-native
建立信任品牌——因為信任在 AI 時代更值錢

九、結論：你站在哪一邊？

Karpathy 的演講不是預言，而是描述。他描述的不是「將來可能發生什麼」，而是「已經在發生什麼」。

讓我們回顧他在這場演講中畫出的清晰圖景：

Software 3.0 不是漸進升級，而是範式革命——從寫程式碼到寫上下文，從指揮機器到與 AI 共創
Vibe Coding 抬升了地板——每個人都能寫軟體了，但品質、安全、架構依然需要人類判斷
Agentic Engineering 拉高了天花板——頂尖工程師的生產力被放大到遠超 10 倍
可驗證性決定自動化速度——可驗證的領域飛速進步，不可驗證的領域停滯
鋸齒狀智能是特性不是 bug——但它也是你必須學會駕馭的特性
理解力是最後的壁壘——因為理解力不可驗證，所以 RL 無法直接改善它

最後，Karpathy 在離開舞台前的最後幾秒鐘，給出了他對教育的看法——那些增強理解力的工具，才是最有趣、最令人興奮的方向。他自己的 LLM 知識庫專案就是這個方向的實踐：不是讓 AI 代替你理解，而是讓 AI 幫你從不同角度「投射」資訊，讓你獲得更深的洞見。

本文最終判斷

在 Software 3.0 時代，贏家公式已經改變。

舊公式：最好的工程師 + 最好的程式碼 = 贏
新公式：最深的理解 + 最好的 AI 指揮能力 + 最強的可驗證性設計 = 贏

Karpathy 沒有說程式設計師會消失。他說的是：「寫程式碼」這個動作會消失，但「理解系統」這個能力會變得比以往任何時候都更有價值。

你可以外包你的思考。但你無法外包你的理解。

那你今天，理解了什麼？

十、系列導讀

Sequoia AI Ascent 2026 深度解讀（共 3 篇）

系列主題：AGI 不是未來，是現在——而你只有 18 個月的窗口。

第一篇（總論）：This is AGI — Sequoia 的運算革命宣言
Sequoia 三位合夥人的 Keynote：運算革命 vs 通訊革命、MAD 策略框架、Agent 四階段演進
第二篇（本文）：Software 3.0 — 從 Vibe Coding 到 Agentic Engineering
Karpathy 的軟體革命宣言：LLM 即電腦、可驗證性框架、理解不能外包
第三篇：The Great Parallel — Jim Fan 的機器人終局論
NVIDIA Jim Fan：大平行理論、WAM 取代 VLA、物理圖靈測試倒計時

參考文獻

Andrej Karpathy, "From Vibe Coding to Agentic Engineering", Sequoia AI Ascent 2026, April 2026. YouTube
Andrej Karpathy, "Software 2.0", Medium, November 2017. Link
Karpathy, A., "Vibe Coding", X/Twitter, February 2025. 原始推文定義 vibe coding 概念
Karpathy, A., "Verifiability", personal blog, 2026. 關於可驗證性與 LLM 能力的深入分析
Karpathy, A., "We are summoning ghosts, not breeding animals", personal blog, 2026. AI 本體論探討
Boris Cherny (Claude Code creator), Sequoia AI Ascent 2026 presentation. 一個工程師指揮 10-15 條並行 AI 工作流的實踐
Sequoia Capital, "AI Ascent 2026 Keynote: This is AGI", April 2026. YouTube
Greg Brockman, "Human Attention Is the New Bottleneck", Sequoia AI Ascent 2026. 人類注意力瓶頸觀點
Ethan Mollick, "Jagged Intelligence", research on uneven AI capabilities. 鋸齒狀智能的學術研究
Menu Gen by Karpathy — menugen.ai. Karpathy 的 vibe coding 代表作品

Software 3.0 — 從 Vibe Coding 到 Agentic Engineering

摘 要

一、Software 1.0 → 2.0 → 3.0：三次軟體革命

Software 1.0：人類寫規則

Software 2.0：機器學整理數據集

Software 3.0：用自然語言「程式設計」

Menu Gen 悖論：整個應用層可能不需要存在

二、Vibe Coding：當寫程式變成寫作文

Vibe Coding 的本質是什麼？

三、Agentic Engineering：天花板在哪裡？

10x 工程師的迷思已經過時

Agentic Engineer 長什麼樣？

招聘也必須改變

四、可驗證性框架：什麼能交給 AI？什麼不能？

為什麼 AI 如此「鋸齒」？

因素一：可驗證性決定 RL 效果

因素二：實驗室的關注度分配

可驗證性光譜

五、一個工程師指揮 15 條 AI 工作流

Boris Cherny 的工作方式

Context 是新的程式設計

六、「理解不能外包」——Karpathy 的警告

思考 vs. 理解：關鍵區分

幽靈 vs. 動物

七、歷史印證：每次工具革命都淘汰了誰？

八、商業啟發：企業主該怎麼重新定義「工程師」

九、結論：你站在哪一邊？

十、系列導讀

參考文獻

相關文章

摘要