Shopify Storefront AI Agent 實戰:用 Claude Opus 4.6 打造 Agentic Commerce,B2B 代理商對代理商的商業模式已經浮現
Shopify Storefront AI Agent 正在重新定義電商的基礎架構。 我們最近在替客戶導入 Shopify Storefront AI agent 時,用了 Claude Opus 4.6 當底層推理引擎,過程中看到一個讓人背脊發涼的趨勢:B2B 的「代理商對代理商」(Agency-to-Agency)商業模式已經不是概念驗證了,它正在成形。Shopify 與 Google 在 2026 年初共同發布的 Universal Commerce Protocol(UCP)讓 AI agent 可以直接跟商家的庫存、結帳、訂單管理系統溝通,而 Claude Opus 4.6 的 1M token 上下文視窗和 agent teams 功能,讓一個 AI 可以同時操作數十個工具,從產品搜尋到完成結帳不需要人類介入。截至 2026 年 4 月,UCP 已經獲得超過 20 家零售商和平台背書,包括 Visa、Mastercard、Stripe、PayPal、Target、Walmart、Best Buy。
這篇文章不談空泛的「AI 會改變電商」。我們拆解實作過程中遇到的技術決策、商業結構變化,以及為什麼 B2B agency-to-agency commerce 會比多數人想像的更快到來。
實作架構:Claude Opus 4.6 + Shopify Storefront MCP
為什麼選 Claude Opus 4.6
我們測試過三款主流模型來驅動 Storefront AI agent。選擇 Claude Opus 4.6 的理由很具體:
| 評估維度 | Claude Opus 4.6 | GPT-4o | Gemini 2.5 Pro |
|---|---|---|---|
| 上下文視窗 | 1M tokens | 128K tokens | 1M tokens |
| 最大輸出 | 128K tokens | 16K tokens | 65K tokens |
| Agent 工具呼叫可靠度 | Terminal-Bench 2.0 最高分 | 中高 | 中高 |
| 多步驟 agentic 規劃 | 原生 agent teams 支援 | 需外部框架 | 原生支援但穩定度略低 |
| 長時間任務維持性 | Context compaction 機制 | 容易偏移 | 尚可 |
| API 定價(百萬 token) | 輸入 USD 5 / 輸出 USD 25 | 輸入 USD 2.5 / 輸出 USD 10 | 依規格而定 |
定價上 Claude Opus 4.6 確實不便宜。但在 agentic commerce 的場景裡,agent 需要在同一個 session 裡處理產品搜尋、庫存確認、折扣計算、結帳建立、付款驗證這整條流程,中間不能「忘記」任何上下文。1M token 的上下文視窗加上 context compaction(自動偵測 token 接近上限時壓縮歷史對話),讓整個流程可以跑完不斷線。
Anthropic 在 2026 年 2 月 5 日發布 Opus 4.6 時,同步推出了 agent teams 功能。一個 lead agent 協調全局,多個 teammate agent 平行處理子任務,每個 teammate 有自己獨立的上下文視窗。在我們的實作裡,lead agent 負責理解使用者意圖和結帳邏輯,兩個 teammate 分別處理 Catalog MCP 的產品搜尋和 Storefront MCP 的店面政策查詢。
Shopify 的三層 MCP 架構
Shopify 在 Winter '26 Edition 正式推出的 agentic commerce 堆疊有三個 MCP 層:
| MCP 層級 | 功能 | 適用場景 |
|---|---|---|
| Catalog MCP | 跨平台產品搜尋,涵蓋 Shopify 上數十億商品 | AI agent 替使用者找商品 |
| Storefront MCP | 單一商家的產品資料、退貨政策、FAQ、品牌語調 | agent 理解特定店家的規則 |
| Checkout MCP | 建立結帳 session、更新購物車、完成交易 | agent 代替使用者結帳 |
Hydrogen 2026.1.4 版本之後,Storefront MCP 變成預設啟用。只要 proxyStandardRoutes 維持預設的開啟狀態,每個 Hydrogen storefront 自動在 /api/mcp 暴露 MCP endpoint。這代表每個用 Hydrogen 建的商店,預設就是「AI agent 可以直接跟它對話」的狀態。
用 Liquid theme 的商家也可以透過 Shopify Catalog 被 AI 發現,但缺少 Storefront MCP 的結構化 API 存取能力。差異很明顯:Hydrogen 商店是 AI-native 的 commerce endpoint,Liquid 商店是 AI-discoverable 的傳統網頁。
實作中的關鍵決策
建 Storefront AI agent 的時候,幾個決策點影響最大:
資料品質比模型選擇重要。 AI agent 是字面意義上的「照規格做事」。產品資料裡的 SKU 不一致、庫存數字有延遲、屬性命名不統一(同一個欄位有的商品叫「顏色」、有的叫「Color」、有的叫「色系」),agent 就會出錯。我們花了大約 40% 的時間在資料清理上,遠超過寫 agent 邏輯本身。
UCP 的 capability negotiation 機制很關鍵。 不是每個商家都支援所有功能。UCP 設計了一套 agent 跟商家「握手協商」的機制:商家宣告自己支援哪些 capabilities(結帳、訂單管理、折扣堆疊等),agent 讀取後只操作雙方都支援的功能。這讓一個 agent 可以服務能力等級不同的商家,不用為每家寫客製邏輯。
安全邊界要從第一天就設計好。 Agent 可以代替使用者結帳意味著它可以花使用者的錢。UCP 的 Agent Payments Protocol(AP2)用密碼學簽章來證明使用者確實授權了這筆交易,但 agent 端的權限控管(能不能自動套折扣、能不能修改配送地址、能不能取消訂單)要在 agent 設計階段就鎖死,不能靠 prompt engineering 來防。
B2B Agency-to-Agency Commerce:看到的未來
這是讓我最不安的部分。
在替客戶建 Storefront AI agent 的過程中,我們意識到一件事:如果 agent 可以代替消費者跟商家交易,那 agent 也可以代替代理商跟另一家代理商的 agent 交易。
現在的 B2B 代理商模式
目前大多數 B2B agency 的運作方式:
- 客戶透過 email / 電話 / 表單提出需求
- 業務人員理解需求,手動搜尋合適的服務或產品
- 跟內部團隊或外部合作夥伴溝通報價
- 來回議價、修改 scope
- 簽約、執行、交付
每一步都是人對人。效率瓶頸在溝通成本,不在技術能力。
UCP + A2A 之後的模式
UCP 的設計不只支援「agent 對商家」,它的 transport layer 原生支援 Agent-to-Agent(A2A)通訊。兩個 agent 可以直接用結構化的 UCP 資料溝通,不需要透過 HTTP request/response 的傳統模式。
想像這個場景:一家品牌客戶的 AI agent 需要找到「能在 3 週內完成 Shopify Plus 到 Hydrogen 遷移、有台灣本地金流串接經驗的代理商」。這個 agent 可以:
- 透過 Catalog-like 的代理商能力目錄搜尋符合條件的 agency
- 用 A2A protocol 直接跟候選 agency 的 agent 溝通
- Agency 的 agent 根據內部資源排程自動回覆可行性和報價
- 雙方 agent 協商 scope 和時程
- 議定後產出 SOW 草稿,送給雙方人類決策者最終確認
整個流程裡人類只需要在最後一步做 yes/no 決策。前面四步全部是 agent-to-agent。

為什麼說這「很快」會發生
三個條件已經到位:
第一,協議層成熟了。 UCP 在 2026 年 4 月已經有 Google、Shopify、Visa、Mastercard、Stripe、PayPal、Walmart、Target、Best Buy、Etsy、Wayfair、BigCommerce、Adobe Commerce、Salesforce 背書。A2A、MCP、AP2 這些子協議都已經有 production-ready 的實作。
第二,AI 推理能力到位了。 Claude Opus 4.6 可以在 14 小時的 agentic task 裡持續維持上下文,一天之內自主處理了 50 人組織裡 6 個 repository 的 13 個 issue。16 個 Claude Opus 4.6 agent 可以從零寫出一個能編譯 Linux kernel 的 C 編譯器。這不是「差不多可以用」的程度,這是「可以信任它做複雜決策」的程度。
第三,Forrester 預測到 2028 年,近九成的 B2B 採購將由 AI agent 介入。 三分之一的 B2B 支付流程在 2026 年底前會用到 AI agent。80% 的 B2B 銷售互動已經在線上發生。基礎設施和使用行為都已經準備好了。
這對代理商(Agency)意味著什麼
如果你經營的是 B2B 服務型代理商,以下是你需要思考的:
你的能力需要變成結構化資料。 「我們很會做 Shopify」不夠。agent 需要知道的是:你的團隊有幾個認證的 Shopify Plus 開發者、過去 12 個月完成了幾個 Hydrogen 專案、平均交付週期是幾天、能處理哪些金流串接。這些資訊要以 agent 可讀的格式存在。
報價流程需要半自動化。 如果對方的 agent 在凌晨三點來詢價,你的 agent 要能基於預設規則回覆初步報價。不用完全自動化(複雜專案還是需要人看),但至少初步篩選和報價不能只在上班時間運作。
信任機制需要重新設計。 人類業務員靠關係和口碑建立信任。Agent-to-agent 的世界裡,信任來自可驗證的紀錄:過去的專案交付時間跟承諾的差異、客戶 NPS 分數、程式碼品質指標、SLA 達成率。這些需要有第三方可驗證的機制。
技術深潛:UCP 的分層架構
UCP 的設計參考了 TCP/IP 的分層邏輯,把電商交易拆成獨立演進的層級:
| 層級 | 功能 | 類比 |
|---|---|---|
| Shopping Service(基礎層) | 定義核心交易基元:結帳 session、line items、totals、狀態 | TCP/IP 的傳輸層 |
| Capabilities(能力層) | 獨立版本化的功能模組:Checkout、Orders、Catalog | 應用層協議(HTTP、FTP) |
| Extensions(擴充層) | 領域專屬 schema:忠誠點數、訂閱計費、自訂折扣規則 | 應用層擴充(HTTP/2 的新功能) |
Transport 層支援四種協議:REST(HTTPS+JSON,通用性最高)、MCP(讓 LLM agent 直接呼叫 UCP 的 tools)、A2A(agent 之間直接通訊)、AP2(AI 自主完成付款時的密碼學授權)。
商家不需要實作所有層級。一個只賣 T-shirt 的小店可能只需要 Catalog + Checkout capability。一個 B2B 批發商可能需要 Catalog + Checkout + Orders + 自訂的 net-30 付款條款 extension。Agent 會讀取商家的 UCP manifest 來判斷能做什麼。
Shopify 的 VP of Product Vanessa Lee 在 Winter '26 Edition 的發布中提到,他們花了 20 多年理解全球商業的複雜性,UCP 的設計就是要模擬這個複雜性而不是簡化它。Google 的 Merchant Shopping VP/GM Ashish Gupta 在同一場合說,UCP 提供了跨生態系的共通語言,讓 agent、商家、支付服務商可以用一致的方式溝通。
數據快照:Agentic Commerce 的市場規模
| 指標 | 數據 | 來源 |
|---|---|---|
| Shopify 2025 BFCM 全球銷售額 | USD 14,600,000,000(約 NTD 467,200,000,000)四天內完成 | Shopify Winter '26 Edition |
| BFCM 尖峰每分鐘銷售額 | USD 5,100,000(約 NTD 163,200,000) | Shopify Winter '26 Edition |
| B2B 銷售互動已在線上發生的比例 | 80% | Gartner |
| 預計到 2028 年 B2B 採購由 AI agent 介入的比例 | 近 90% | Forrester |
| 2026 年底前 B2B 支付流程使用 AI agent 的比例 | 三分之一 | Forrester |
| UCP 背書企業和平台數量 | 超過 20 家 | Shopify / Google 官方公告 |
| 使用 AI agent 的 B2B 團隊成交速度提升 | 最高 36%(64 天縮短至 41 天) | Peak Sales Recruiting |
| 2026 年企業應用整合任務型 AI agent 的比例 | 40%(2025 年不到 5%) | Gartner |
| 94% 的 B2B 買家在採購過程中使用 LLM | 94% | 6sense 2025 Buyer Experience Report |
我們從實作中學到的五件事
1. 不要低估資料治理的工作量。 我們原本預估 20% 的時間花在資料,實際花了 40%。商品描述不一致、庫存同步有延遲、metafield 命名混亂,這些都會讓 agent 出錯。AI agent 是字面意義上的照規格辦事,資料品質直接等於 agent 品質。
2. Storefront MCP 的 Knowledge Base 功能被嚴重低估。 Shopify 讓商家透過 Knowledge Base App 管理退換貨政策、FAQ、品牌語調。Agent 會用這些資料來回答消費者問題。設定得好,agent 的回覆品質可以超過大多數客服人員。設定得差,agent 會給出跟品牌完全不搭的回覆。
3. Claude Opus 4.6 的 adaptive thinking 在結帳流程裡省了很多 token。 簡單的加到購物車操作不需要深度推理,複雜的折扣堆疊和配送選項計算需要。Adaptive thinking 讓模型自己判斷什麼時候需要「多想一下」,不用我們手動設定每一步的 thinking budget。
4. 人機交接點的設計是最難的部分。 UCP 有一個 checkout status 叫 requires_human,代表這筆交易有些環節需要人類介入(例如法規要求、商家政策、或 agent 能力不足的情況)。設計什麼時候觸發 requires_human,以及觸發後的使用者體驗要怎麼接,比寫 agent 邏輯本身還複雜。
5. Agent-to-agent 的測試很難寫。 傳統的 API 測試有固定的 request/response 模式。Agent-to-agent 的互動是動態協商的,同樣的起始條件可能走出不同的對話路徑。我們最後改用基於結果的測試(交易有沒有完成、金額對不對、時間有沒有在 SLA 內),而不是基於路徑的測試。
Shopify Storefront AI Agent 到底是什麼?
Shopify Storefront AI Agent 是一種透過 Storefront MCP 跟 Shopify 商店直接溝通的 AI 程式。它可以搜尋產品、查詢政策、管理購物車、引導結帳,全部透過結構化的 API 完成,不是在網頁上模擬點擊。Shopify 在 Hydrogen 2026.1.4 版本後,預設啟用 Storefront MCP proxy,所有 Hydrogen 商店自動成為 AI agent 可互動的 commerce endpoint。
UCP 跟 MCP 有什麼差別?
UCP(Universal Commerce Protocol)是定義 AI agent 如何跟商家交易的開放標準,涵蓋從產品發現到結帳到售後的完整商業生命週期。MCP(Model Context Protocol)是 UCP 的傳輸協議之一,讓 LLM-based 的 agent 可以直接呼叫 UCP 定義的 tools。簡單說,UCP 定義「做什麼」,MCP 是「怎麼傳」的方式之一。UCP 同時也支援 REST、A2A 和 AP2 等其他傳輸方式。
非 Shopify 的商家怎麼辦?
UCP 是開放標準,BigCommerce、Adobe Commerce、Salesforce 都已經背書。但目前原生支援最完整的是 Shopify 的 Agentic Storefronts,只要在後台開啟就能用。非 Shopify 商家需要自行實作 UCP 的 Shopping Service 和相關 capabilities,目前 Google 有提供 Python 參考實作可以參考。
建一個 Storefront AI Agent 需要多少預算?
我們的經驗是:對一個已經有 Hydrogen storefront 的中型品牌,從規劃到上線大約需要 6-10 週,包含資料清理(占比最大)、agent 邏輯開發、UCP capability 設定、安全審核和測試。Claude Opus 4.6 的 API 成本取決於交易量,以每天 1,000 筆 agent 互動估算,每月 API 費用大約在 USD 500-2,000(約 NTD 16,000-64,000)之間,視每次互動的 token 用量而定。
Agent-to-Agent B2B Commerce 什麼時候會普及?
基礎協議已經到位(UCP 的 A2A transport),技術能力也到位(Claude Opus 4.6 可以執行 14 小時以上的 agentic task)。瓶頸在商業信任機制。B2C 場景裡 agent 代替消費者下單,風險可控。B2B 場景裡 agent 代替企業簽約,涉及的法律責任、合規要求、金額規模都不同。Forrester 預測到 2028 年近九成的 B2B 採購會有 AI agent 介入,但「介入」不等於「全自動」。比較實際的時間表是:2026-2027 年半自動化(agent 做初步篩選和報價,人類做最終決策),2028-2029 年高度自動化(例行性採購由 agent 全程處理)。
引用來源
- Shopify — Universal Commerce Protocol (UCP) Architecture
- Shopify — Agentic Commerce at Scale Announcement
- Google Developers Blog — Under the Hood: Universal Commerce Protocol
- Anthropic — Introducing Claude Opus 4.6
- commercetools — Agentic Commerce in B2B: From Efficiency to Autonomy
- Shopify — Winter '26 Edition Developer Platform
Author Insight
我們團隊在替客戶建 Shopify Storefront AI agent 的過程中,最大的體悟不是技術門檻高(Claude Opus 4.6 + Shopify MCP 的整合其實比想像中順),而是商業邏輯的重新定義。當 agent 可以代替人做交易時,「客戶關係」的定義就變了。過去代理商跟客戶的關係靠人際互動維繫,未來一部分的關係會變成「你的 agent 跟我的 agent 合作過幾次、品質如何、回應速度多快」。這不是取代人類關係,但確實是在關係的底層多了一層 machine-readable 的信任紀錄。
我個人覺得最讓人不安的不是技術本身,而是速度。UCP 從公告到有 20 多家企業背書只花了幾個月。Hydrogen 從不支援 Storefront MCP 到預設啟用只隔了一個版本更新。Agent teams 從概念到 production-ready 在 Opus 4.6 直接隨附。每一個環節都在加速,而大多數 agency 還在用 email 接案子。
如果你的 B2B 服務有標準化的定價和交付流程,建議現在就開始把能力目錄結構化,至少讓 agent 可以讀取。不需要一步到位做成全自動,但「可被 agent 發現」是最基本的起步。
Tenten 是台灣第一批在 production 環境用 Claude Code 和 Claude Opus 4.6 建 Shopify Storefront AI agent 的團隊。如果你在評估 agentic commerce 的導入策略,或者想了解你的 Shopify 商店怎麼接入 UCP 生態系,歡迎跟 Tenten 團隊預約諮詢。
