九成軟體工程師已經在用 AI 寫程式,但多數人還停留在跟單一 AI 一對一互動的階段。2026 年的前沿開發者正在做的事完全不同:他們同時管理 5 到 30 個 AI coding agent,讓這些 agent 各自在獨立的 Git worktree 裡並行工作,然後審查合併產出的 pull request。Google Chrome 團隊工程總監 Addy Osmani 把這個轉變定義為「從 conductor(指揮者)到 orchestrator(編排者)」的演化。Gartner 預測,agentic orchestration 到 2029 年將重新分配全球 5,500 億美元(約 NTD 17.6 兆)的軟體與服務支出。
這篇文章拆解 conductor 和 orchestrator 兩種角色的具體差異,盤點 2026 年主要的多 agent 編排工具,並分析這個轉變對開發團隊的實際衝擊。
Conductor 模式:你和一個 AI 的即時協作
Conductor 就是目前大多數開發者跟 AI 互動的方式。你在 IDE 或 CLI 裡跟一個 AI agent 即時對話,逐步引導它完成任務。Cursor、Claude Code 的單 session 模式、GitHub Copilot 的行內建議,都屬於 conductor 工具。
這種模式的運作邏輯很直覺:你下 prompt,agent 回應,你檢查、修正、再迭代。像是有個隨時待命的 junior 工程師坐在旁邊。Osmani 用 GPS 導航來比喻——conductor 跟 agent 之間維持著緊密的即時回饋迴路,每一步都由人來驗證或修正方向。
Conductor 模式已經帶來顯著的生產力提升。根據 Anthropic 2026 年 Agentic Coding Trends 報告,開發者約 60% 的日常工作已經有 AI 介入。問題在於天花板很明顯:一次只能跟一個 agent 互動、同步執行、受限於單一 context window。你再怎麼會用 Cursor,一個下午頂多做完一個功能模組。
Orchestrator 模式:你管理一支 AI 團隊
Orchestrator 的邏輯完全不同。你不是在寫程式,你在分配工作、定義任務邊界、審查產出。就像從 pair programming 變成管理一支開發團隊。
具體來說:你把一個功能拆成前端、後端、測試三個任務,分別指派給三個 agent。每個 agent 在獨立的 Git worktree 或雲端 VM 裡工作,互不干擾。你去喝杯咖啡回來,桌上等著三個 PR。
Anthropic 研究員 Nicholas Carlini 在 2026 年初做了一個實驗:他同時調度 16 個 Claude agent,從零開始用 Rust 寫了一個無外部依賴的 C 編譯器,能編譯 Linux kernel 6.9,通過 99% 的 GCC torture test。整個過程橫跨約 2,000 個 session。這不是概念驗證,是實際可用的軟體。
Anthropic 的內部數據也支持多 agent 架構的效能優勢:以 Claude Opus 做主導 agent、Claude Sonnet 做 sub-agent 的多 agent 系統,在研究任務評估上比單一 Claude Opus 的表現高出 90.2%。增益的來源是 context isolation——每個 sub-agent 只維護跟自己任務相關的 context,避免長 session 的 context 腐化。

Steve Yegge 的八級進化框架
前 Google 工程師 Steve Yegge 在 2026 年初提出了一個被廣泛引用的開發者 AI 進化框架,把開發者跟 AI 的關係分成八級:
| 層級 | 描述 | 工作模式 |
|---|---|---|
| L1 | 不用 AI | 純手寫 |
| L2 | IDE 裡有 agent,需要逐步授權 | 每次檔案變更都要批准 |
| L3 | YOLO 模式 | 關掉權限確認,信任度上升 |
| L4 | agent 佔滿螢幕,程式碼只看 diff | 對話引導取代逐行審查 |
| L5 | CLI 單 agent,YOLO | diff 捲過去,不一定看 |
| L6 | CLI 多 agent,3-5 個並行 | 速度飛躍 |
| L7 | 10+ agent,手動管理 | 開始碰到管理上限 |
| L8 | 自己寫 orchestrator | 建立專屬編排系統 |
Osmani 在 2026 年 3 月的 O'Reilly CodeCon 演講中指出,多數開發者卡在 L3-L4,orchestration 從 L6 才開始。L5 是分水嶺:過了這一級,你需要的技能組合跟之前完全不同——從「怎麼寫好程式」變成「怎麼分解任務、驗證產出」。
Yegge 自己用他開發的 Gas Town 系統同時跑 20-30 個 Claude agent。他在 O'Reilly 訪談裡的原話是:程式碼是液體,你用水管噴出來,不用盯著看。
不過他也誠實地提到代價。他現在每天都要午睡,有時候一天睡兩次。多 agent 工作流改變的是到達你桌上的工作類型:認知強度極高,持續不斷。他把這個稱為「AI 吸血鬼效應」:不是老闆逼你加班,是 Claude 問你「這個專案還有什麼要我做的嗎?」你會一直說好,因為很好玩、很有生產力。

2026 年的多 agent 編排工具版圖
Osmani 把工具分成三個層級(tier),不同層級解決不同場景:
Tier 1:內建子 agent(入門級)
Claude Code 的 sub-agent 和 Agent Teams 功能。單一終端 session 裡產生子 agent,不需要額外工具。Agent Teams 在 2026 年 2 月隨 Claude Opus 4.6 發布,引入了 sub-agent 之間的 peer-to-peer mailbox 通訊和共享任務列表。Anthropic 在 3 月 9 日用 Agent Teams 建了 Claude Code Review,把內部程式碼審查覆蓋率從 16% 拉到 54%。
Tier 2:本機多 agent 編排(中階)
你的機器在獨立 worktree 裡跑多個 agent,有 dashboard 監控和 diff 審查。適合 3-10 個 agent 在熟悉的 codebase 上工作。主要工具包括 Conductor(Melty Labs,macOS 專用,視覺化 dashboard,BYOK)、Claude Squad(開源 terminal app,用 tmux 分割多個 Claude Code instance)、Cursor Background Agent,以及 Vibe Kanban(BloopAI,跨平台 Kanban board,支援 Claude Code、Codex、Gemini、Amp)。
Tier 3:雲端非同步 agent(進階)
指派任務、關上筆電、回來收 PR。agent 在雲端 VM 裡跑,不需要本機終端。主要選項有 Claude Code Web、GitHub Copilot Coding Agent、Jules(Google)、OpenAI Codex。
多數 2026 年的前沿開發者會同時使用三個 tier:Tier 1 用在即時互動工作,Tier 2 用在並行衝刺,Tier 3 用在睡覺時消化 backlog。
為什麼多數團隊現在不該急著導入 orchestration
Aviator Blog 的分析講了一個很實際的觀點:如果你從單一 agent 都拿不到穩定價值,十個 agent 只會放大混亂。
幾個不適合的情境:團隊少於 10 人工程師,協調成本會吃掉你。沒有足夠的可並行化工作來支撐複雜度。沒有健全的 CI/CD 和 code review 流程,orchestrator 不會取代工程紀律,只會放大你現有的一切,包括問題。
Gas Town 使用者報告每月 Claude API 費用超過 USD 200(約 NTD 6,400)。你是拿錢換吞吐量,不是省錢。
Gartner 預測超過 40% 的 agentic AI 專案會在 2027 年底前被取消,原因是成本失控、商業價值不清楚或風控不足。Gartner 估計市場上數千個 agentic AI vendor 裡,只有大約 130 家是真的。
80% 問題:agent 很強,但最後 20% 靠你
Osmani 在 2026 年 1 月的文章裡定義了「80% 問題」:agent 可以快速生成 80% 的程式碼,但剩下的 20% 需要對 context、架構、取捨的深度理解。
實際碰到的坑包括假設傳播(model 在早期誤解需求,基於錯誤前提蓋了整個功能,五個 PR 之後才發現)、抽象膨脹(放手讓 agent 跑,100 行能解決的事做成 1,000 行)、死碼累積(agent 不清理自己的產出)、順從性同意(agent 不推回你,只有對描述的熱情執行,即使描述不完整)。
Wes McKinney(pandas 作者)的經驗佐證了這一點。他每月消耗超過 100 億個 token,用 Claude、Codex、Gemini 寫大量 Go 語言(一個他從來沒手動寫過的語言)。他發現了一個他稱為「brownfield barrier」的現象:約到 10 萬行程式碼時,agent 開始被自己生成的肥大 codebase 噎住。
Brooks 1975 年在《人月神話》裡的論點依然成立:加更多人(或 agent)到一個遲滯的軟體專案,只會讓它更遲。agent 不會碰本質複雜度,反而會以機器速度引入新的偶發複雜度。
品味是最後的稀缺資源
Yegge、McKinney、Tim O'Reilly 和 Osmani 在 2026 年不約而同收斂到同一個結論:品味(taste)是 AI 時代最後的競爭優勢。
Yegge 引用 Richard Sutton 的 bitter lesson 作為日常運作原則:原始計算能力總是勝過人類手工設計的結構。他的實測標準很簡單——如果你在寫程式碼讓 AI 變聰明(加 heuristics、parser、regex 來處理 model 本來就能處理的事),你就站在 bitter lesson 的錯誤那邊。
反過來說,如果你有品味,你知道該建什麼、什麼該砍掉、架構怎麼組,槓桿率比以前更高。Yegge 判斷創意勝過資本——會有公司浪費幾百萬美元的 token 生成一堆永遠不會上線的軟體,因為沒品味、沒好點子,只有不帶方向的暴力生成。
開發者如何準備這個轉變
根據 Anthropic 的報告和前沿開發者的實務經驗,有幾個具體的著力點。
先在 L5 站穩。如果你還在 L2-L3,急著跳到 orchestration 沒有意義。先學會用 Claude Code CLI 或 Gemini CLI 以 YOLO 模式跑完整功能,把信任度建立起來。
投資在 Context Engineering。問題定義和驗證策略佔成功開發者 70% 的時間,執行佔 30%。好的 CLAUDE.md、AGENTS.md、DESIGN.md 文件是 orchestrator 的基礎設施。
建立測試護城河。多 agent 並行工作時,整合測試是唯一能抓住跨 agent 問題的防線。沒有健全的 CI/CD pipeline,orchestration 只會製造更快的混亂。
練習 code review at scale。你的產出速度從一天幾百行變成一天幾千行。如果閱讀程式碼的速度跟不上 agent 輸出的速度,你不是在做工程,你在累積技術債。
Agentic Coding 適合什麼類型的專案?
新專案(greenfield)和 agent 的契合度最高。Osmani 觀察到在個人 side project 和新專案上,80% 以上的程式碼可以交給 agent。但在大型既有專案(brownfield)裡,agent 的效能明顯下降,尤其是涉及多人協作和複雜依賴關係的場景。
Orchestrator 模式的成本大概多少?
以 Claude API 計價,跑 3-5 個並行 agent 大約每月 USD 100-200(約 NTD 3,200-6,400)。Gas Town 等級的 20-30 個 agent 可以超過 USD 200/月。Anthropic 2026 年 4 月推出的 Claude Managed Agents 服務另收 USD 0.08/session hour,加上標準 token 費用。
非技術人員也能用 Agentic Coding 嗎?
Anthropic 的報告指出,Vibe Coding 正在讓寫程式和不寫程式的邊界變得模糊。Zapier 內部達到 89% 的 AI 採用率,部署了 800 多個 AI agent,設計團隊用 Claude artifact 在客戶訪談中即時做出原本要幾週才能完成的設計原型。不過 orchestrator 模式目前仍然需要工程背景。
A2A 協議是什麼?跟 MCP 有什麼關係?
A2A(Agent-to-Agent)是讓不同廠商的 agent 透過結構化 JSON 互相交接工作的標準。MCP(Model Context Protocol)處理的是 agent 跟外部工具和資料來源的連線。兩者互補:MCP 讓 agent 能用工具,A2A 讓 agent 能跟其他 agent 協作。
台灣企業現在該做什麼?
不需要急著追 orchestration。先盤點團隊目前在 Yegge 八級框架裡的位置。多數台灣開發團隊大概在 L2-L4,應該先投資在 Claude Code 或 Cursor 的 conductor 模式訓練,建立 AI 協作的肌肉記憶,再往多 agent 方向演進。
引用來源
- Addy Osmani — The Future of Agentic Coding: Conductors to Orchestrators
- Addy Osmani — The Code Agent Orchestra
- O'Reilly — Steve Yegge Wants You to Stop Looking at Your Code
- Gartner — Agentic Orchestration $550B AI Control Plane
- Anthropic — Claude Code Agent Teams Documentation
- Aviator — The Rise of Coding Agent Orchestrators
Author Insight
我們團隊從 Cursor 遷移到 Claude Code 做為主力開發工具後,先在 Tier 1 的 sub-agent 模式跑了兩個月,才開始嘗試 Tier 2 的多 agent 並行。過程中最大的教訓是:在單一 agent 模式下建立的 CLAUDE.md 和專案規範文件品質,直接決定了多 agent 模式能不能用。Context engineering 的投資報酬率遠高於追逐新工具。
我觀察到台灣企業在 AI coding 的採用速度其實不慢,但多半卡在 L3-L4 的 conductor 階段。瓶頸通常不是工具選擇,而是缺少明確的專案規範文件和測試基礎設施。先把這兩件事做好,orchestrator 模式的導入會順很多。
如果你的團隊正在評估 Claude Code、Cursor 或其他 AI 程式工具的導入策略,歡迎跟 Tenten 團隊預約諮詢,我們可以根據你的 codebase 規模和團隊組成,規劃從 conductor 到 orchestrator 的漸進路線。
