Karpathy 從 2025 年 12 月起就沒再親手寫過一行程式碼。 這位 OpenAI 共同創辦人、前 Tesla AI 總監,在 No Priors Podcast 上說他現在把八成以上的編碼工作交給 AI Agent 處理,自己則處於一種他稱之為「AI 狂熱症」(AI psychosis)的狀態。這件事之所以值得認真討論,不只因為他的身份,而是因為背後有硬資料在撐:史丹佛數位經濟實驗室 2025 年 8 月發表的研究,分析了 ADP 數百萬筆薪資紀錄,發現 22 到 25 歲軟體開發者的就業人數自 2022 年底以來下降了將近 20%。美國勞工統計局的資料則顯示,2023 到 2025 年間程式設計師整體就業人數下降了 27.5%。軟體工程這個行業正在經歷一場結構性的重組,而 Karpathy 的個人經歷恰好是這場重組最前線的切片。

從拉小提琴到拿指揮棒:宏觀動作的崛起

Karpathy 在訪談裡描述的工作方式,已經跟多數人理解的「寫程式」完全不同了。他在大螢幕上同時跑多個 AI 編碼代理(主要是 Claude CodeCodex),每個代理被分配一個大約 20 分鐘能處理完的任務。他自己在這些平行工作流之間快速切換,負責拆解任務、下達指令、審核輸出。

Peter Steinberger(OpenClaw 前身 Clawdbot 的開發者)的工作模式更極端。他同時指揮十幾個代理進行高強度並行開發,每個代理就像一個不會累的初階工程師。Steinberger 後來承認這種工作強度讓他必須暫時退出來顧心理健康。

這裡的轉變可以用一個比喻說清楚:以前工程師是交響樂團裡拉小提琴的樂手,每天在練指法、磨音準。現在系統要你放下琴,站上指揮台,去統領一整個虛擬樂團。能力需求從「寫出好程式碼」變成「拆解問題、分配任務、審核產出」。Karpathy 自己的說法是,這是一個「skill issue」——瓶頸不再是算力或伺服器,而是人類分配和審核 AI 產出的帶寬。


焦慮的性質變了:從缺算力到缺人類頻寬

過去十年,頂尖工程師最缺的是算力。搶顯示卡、排隊等 GPU 叢集、為 server 資源焦慮,這是常態。但現在的情況倒過來了。

如果你訂閱了高階 AI 服務(像 Claude Max 或 ChatGPT Pro),理論上你有接近無限的推理能力。真正的瓶頸變成了「吞吐量」——你一天能讓 AI 為你生成多少行程式碼、處理多少個任務。這群頂尖開發者的邏輯是:如果一天結束時你的 token 消耗量不夠大,代表你沒有充分利用 AI 的產能。系統裡唯一的效能瓶頸,變成了那個需要睡覺、吃飯、反應速度有限的人類大腦。

這催生了業界所謂的「新技能危機」。做不出好產品不再是因為缺資源,純粹是因為你駕馭 AI Agent 的能力不夠。


Dobby 家庭管家:當 AI 接管你的物理空間

Karpathy 把這種代理能力從軟體開發延伸到了日常生活。他建了一個家庭 AI 管家,取名 Dobby(對,就是哈利波特裡那個家庭小精靈)。Dobby 的運作方式是透過 WhatsApp 接收自然語言指令,然後在後台自動完成所有操作。

一個具體例子:Karpathy 隨口問了一句「Dobby 你能找到我家的 Sonos 音響嗎?」AI 沒有叫他打開手機 APP 或輸入 IP 位址。它直接在後台寫了一段 Python 腳本,掃描整個家庭區域網路,找到音響,發現它沒有密碼保護,然後自動從網路上爬取開發文件,逆向工程找出所有控制 API。等 Karpathy 反應過來的時候,音樂已經在書房響起了。整個過程只接收了一句人類語言,剩下的全部自己形成閉環。

後來 Dobby 接管了家裡的燈光、空調、泳池,甚至安防系統。在安防方面,它不用傳統的紅外動作感測器,而是直接接入視覺模型去分析監控畫面。偵測到門外有變動時,它能區分「被風吹動的樹葉」和「一輛 FedEx 快遞車停在路邊」,然後主動透過 WhatsApp 發提醒給 Karpathy。


去 APP 化的推演:API 才是未來的介面

Dobby 的案例指向一個更大的趨勢。如果 AI 可以透過底層 API 直接操控所有智慧裝置,那我們手機裡那幾百個功能單一、佔記憶體、還得學怎麼用的 APP,有多少是冗餘的?

這個推演的終點是:硬體廠商不再需要養團隊開發 APP,只需要暴露最底層的 API 介面。人類面對的只有一個全能的對話框或語音助手。AI 代理負責理解你隨口說出的模糊指令,然後在後台以毫秒級速度完成所有複雜的程式碼呼叫。

有人會問:每次開燈都要講一串話,不比按按鈕更麻煩嗎?這個質疑忽略了「環境感知」這一層。未來的 AI 管家不只聽你說話,還知道你的生物特徵、精準時間、心率、體溫、疲勞度。你拖著疲憊的身體回家說「有點累」,燈光、音響、空調、咖啡機可能在你嘆氣的一秒內全部自動調整。這不是一問一答,是基於環境上下文的深度感知。


自動研究:人類變成 AI 進化的最大瓶頸

如果把 AI 代理的能力指向科研呢?這就是 Karpathy 訪談中提到的 Auto Research 概念。

Karpathy 在微調大模型時遇到一個讓他衝擊很大的經驗。所謂超參數調優(hyperparameter tuning),比如權重衰減(weight decay)、Adam 優化器步長這些控制旋鈕,傳統上被認為是頂尖高手的「玄學手感」,靠的是多年經驗和直覺。Karpathy 一開始堅信自己 20 年功力調出來的參數已經是最優解。

然後他把這個任務交給了 Auto Research 系統。AI 在整個參數空間裡跑了幾千幾萬次實驗,第二天早上交出了一組人類沒發現過、從人類邏輯看有些反直覺,但結果更好的參數組合。人類引以為傲的經驗,在機器高頻暴力搜索面前不堪一擊。

這直接催生了一個組織設計的推演:如果科研過程本身可以被自動化,那未來的研究機構、甚至商業公司,其核心是什麼?Karpathy 提出了「終極 Program」的概念——用一份邏輯嚴密的 Markdown 文件來定義目標、評價指標、資源上限和邊界規則,然後交給成千上萬個 AI 代理去無止盡地執行、試錯、迭代。公司的實體形態和制度形態可能會完全消解,最核心的東西就是那個幾十 KB 的文件。

AI 的「參差不齊」:超級天才與常識遲鈍兒童的共存

同一個能在幾秒內寫出高難度底層優化程式碼的 AI,你讓它講笑話,它還在講五年前的爛梗。這種能力的極度割裂,學術界稱為 AI 的「jagged frontier」(參差不齊的前沿)。

背後的原因跟強化學習的機制有關。強化學習需要明確、客觀、可自動驗證的回饋信號。寫程式碼有這個——跑得通就是跑得通,損失函數降了就是降了。但幽默感、文化語境、藝術神韻呢?這些沒有編譯器,沒有標準答案,強化學習的齒輪在這裡咬合不上。

這引出了一個路線問題:各大科技巨頭嘗試打造的全知全能單體超級大模型,把所有技能塞進一個大腦的做法,方向對嗎?自然界沒有在所有領域都完美的動物。獵豹跑得快但力量不足,大象力大但不敏捷。未來的 AI 生態也可能出現類似生物界的物種分化——有的專精數學和編碼,有的專精情感理解和創作。事實上,維持全能大模型的訓練和推理成本已經高到連巨頭都快撐不住了。

開源 vs 閉源:分散式進化的游擊戰

閉源前沿模型 開源模型
代表 GPT 系列、Claude Opus LlamaDeepSeek
能力差距(與前沿的落後時間) 基準線 從 18 個月縮短到 6-8 個月
訓練成本 數億到數十億美元 社群分散式貢獻
典型應用場景 可控核融合等離子體控制、新藥分子驗證 嵌入冰箱、車機系統、智慧手錶
戰略意義 科技邊界攻堅 防止解釋權被少數巨頭壟斷

一個值得關注的趨勢是分散式的演算法搜索。尋找好演算法極其耗算力,但驗證一個演算法是否有效只需要極少算力。這種非對稱特性完美契合分散式網路的優勢,有點類似區塊鏈早期的工作量證明模式。任何人——不管身份、不管用多破的電腦——只要找到有效的優化演算法,貢獻就會被系統吸收。

開源模型在 AI 生態中扮演的角色,可以類比 Linux 在作業系統領域的位置。Linux 沒有打敗 Windows 或 macOS 成為桌面霸主,但它悄悄變得無處不在——跑在絕大多數伺服器、手機(Android)、物聯網裝置上。開源 AI 模型可能走同一條路。

原子與比特的鴻溝:為什麼你還沒看到滿街跑的變形金剛

數位世界的 AI 已經進化到能在區域網路裡穿梭、能自己做研究了,為什麼現實中的機器人還這麼笨手笨腳?

因為原子的操控難度比比特高出百萬倍。在數位世界裡,修改一行程式碼、複製 TB 級資料以光速進行,試錯成本接近零。在物理世界裡,機器每次移動都要抵抗重力、摩擦力、熱力學定律。機器人在真實廚房學洗碗時捏碎了一個玻璃杯,你不能按 Ctrl+Z。

但這個瓶頸裡藏著一個商業反轉。如果數位世界的超級 AI 渴求真實的多模態物理世界資料,而物理世界又這麼難搞定,那「連接兩個世界的介面」就是巨大的機會。我們可能很快會看到一種新型僱傭關係:AI 系統為了完成某個模型任務,需要特定場景的真實照片或資料,於是透過手機向人類發出懸賞任務。人類在這個場景裡,諷刺地變成了超級系統用來感知物理世界的「肉體感測器」。


傑文斯悖論:AI 寫程式不會消滅程式設計師,但會徹底改變這份工作

很多人看到 AI 能寫程式碼就斷言程式設計師要失業了。但經濟學中的傑文斯悖論(Jevons Paradox)提供了另一個視角。

1865 年,英國經濟學家 William Stanley Jevons 觀察到,瓦特蒸汽機讓煤炭使用效率大幅提升後,煤炭的總消耗量不減反增。原因是效率提升讓更多產業覺得划算、開始使用煤炭,需求暴漲。ATM 自動提款機的歷史也是同樣的模式。1970 年代 ATM 出現時,所有人都預言銀行櫃員要失業了。但根據 IMF 2015 年的分析,ATM 讓每家分行需要的櫃員從 21 人降到 13 人,降低了營運成本,結果銀行瘋狂擴張網點,城市地區分行數量增加了 43%。從 1980 年到 2010 年,銀行櫃員的總人數反而增加了。只是工作內容從數鈔票變成推銷理財產品和客戶關係管理。

套用在 AI 編碼上:當編寫軟體的成本逼近於零,過去那些「不值得用昂貴人力去解決」的瑣碎需求會被釋放出來。為奶奶的後院花園量身打造一套結合天氣預報的自動灌溉系統?以前沒人願意接這種單子,現在 AI 可以瞬間搞定。GitHub 2025 年的資料顯示,每月合併的 pull request 達到 4,300 萬個,年增 23%;Apple App Store 新增 557,000 個 APP,年增 24%。如果 AI 真的在「取代」開發者,這些數字應該下降才對。

不過要注意的是,傑文斯悖論有一個重要前提:它在「人類仍然需要介入」的環節才有效。ATM 的案例後來有個續集——2010 年後 iPhone 和行動銀行出現,真正讓銀行櫃員人數開始崩跌,因為行動銀行不是優化了舊世界,而是讓分行本身變得不那麼必要了。AI 編碼會不會走到這一步,目前還是開放問題。


教育的斷裂點:知識傳遞從人對人變成人對 AI 對人

Karpathy 提到的 Micrograd 專案,是一個把大模型訓練的核心邏輯壓縮到 200 行程式碼的開源項目,包含資料處理、前向傳播、反向傳播的自動求導引擎和 Adam 優化器。以前這種等級的程式碼出來,作者一定會錄一個一小時的教學影片逐行解說。但 Karpathy 現在覺得,對人類逐行解釋這些東西已經極其低效了。

這意味著人類之間相互解釋複雜概念的時代正在改變。技術文件正在從 HTML 排版改成純文字 Markdown,因為這些文件的主要讀者不再是人類,而是 AI Agent。人類頂尖大腦的未來職責可能是把核心直覺和邏輯框架直接灌給 AI Agent,然後由 Agent 用最適合每個學生認知水平的方式進行客製化教學。

Karpathy 說的「AI 狂熱症」到底是什麼?

Karpathy 用「AI psychosis」形容一種極度沉浸於探索 AI 可能性的狀態。他在 No Priors Podcast 上說,他覺得自己必須站在技術最前沿,看到 Twitter 上其他人做的各種專案時會非常焦慮。這不是精神疾病,而是一種由能力爆發帶來的認知壓力。

AI Agent 寫程式碼的品質能用在生產環境嗎?

根據 Karpathy 的經驗,AI Agent 在樣板程式碼和規格明確的任務上表現很好,但在高度原創、邏輯緊密的程式碼上仍有「認知缺陷」。他以自己的 nanochat 專案為例,指出密集的原創程式碼目前還是需要人類把關。2025 年一項針對 vibe coding 實務的分析也發現,表現最好的團隊不是盲目交任務給 AI,而是有足夠技術深度去精準拆解任務和驗證產出。

開源 AI 模型真的能追上閉源模型嗎?

能力差距正在急劇縮短。從最初落後 18 個月,到現在縮短到 6 到 8 個月甚至更短。開源模型在日常 99% 的運算需求上已經夠用,而且部署成本遠低於閉源方案。但在最前沿的科學突破上,閉源模型仍然有優勢。

傑文斯悖論套用在 AI 上有什麼限制?

傑文斯悖論的前提是「需求具有足夠的價格彈性」。ATM 的案例之所以成立,是因為金融服務的需求在成本下降後確實大幅擴張。但 ATM 最後還是被行動銀行取代了,因為行動銀行不是讓舊模式更便宜,而是讓舊模式變得不必要。如果 AI 發展到完全不需要人類介入的程度,傑文斯悖論就不適用了。

AI 對年輕工程師的就業衝擊有多嚴重?

史丹佛數位經濟實驗室分析 ADP 薪資資料後發現,22-25 歲軟體開發者的就業自 2022 年底高峰下降了近 20%。同期 30 歲以上的開發者就業持平或成長。IEEE Spectrum 引用勞工統計局資料指出,2023-2025 年間美國程式設計師整體就業下降 27.5%。初階和 junior 開發者職缺降了約 40%,但電腦科學畢業生人數還在增加。

引用來源

作者

Ewan | Tech Lead @ Tenten.co

我們在 2025-2026 年間協助超過 30 家企業評估和導入 AI 編碼工具,親身觀察到一個清楚的模式:最先受益的不是技術最強的團隊,而是「最擅長拆解問題」的團隊。從 CursorClaude Code,工具一直在換,但核心能力需求沒變——你能不能把一個模糊的業務需求,拆成 AI Agent 可以執行的明確任務。Karpathy 的經驗對 99% 的企業來說太前沿了,但他揭示的方向是確定的:軟體開發的瓶頸正在從「會不會寫程式」移向「會不會指揮 AI」。企業現在就應該開始培養這種能力,而不是等到被迫轉型。

如果你想討論 AI 編碼工具在你的團隊怎麼落地,或評估 Claude CodeGitHub Copilot 哪個更適合你的技術棧,歡迎跟 Tenten 團隊預約諮詢

Share this post
Ewan Mak

I'm a Full Stack Developer with expertise in building modern web applications that fast, secure, and scalable. Crafting seamless user experiences with a passion for headless CMS, Vercel and Cloudflare

Loading...