AI時代不可不知！AI Agent 架構全解析：從 Google 白皮書到企業落地的技術藍圖

2025 年末，Google 發布「Introduction to Agents」白皮書，標誌著 AI 正從被動的聊天機器人邁向自主代理系統（AI Agents）。這場典範轉移將如何改變企業運作？本文深入剖析 AI Agent 的四大核心架構、五級能力指標、關鍵的 Agent Ops 營運體系，以及企業落地的關鍵策略。

一、 軟體開發的典範轉移：從「砌磚工」到「導演」

人工智慧正經歷一場根本性的轉變。過去幾年，我們熟悉的 AI（如早期的 ChatGPT）主要屬於預測式 AI。Google 白皮書將這種開發模式比喻為「砌磚工（The Bricklayer）」——開發者必須明確定義每一行程式碼的邏輯，告訴 AI 每一步該怎麼做。

如今，我們正進入代理式 AI（Agentic AI）的時代。這時的開發者更像是一位「導演（The Director）」。你不再需要微管理每一個步驟，而是設定場景（環境）、選角（工具）、給予劇本（目標），然後讓 AI Agent 自主規劃路徑、解決問題並應對突發狀況。

這種轉變意味著 AI 不再只是「回答問題」的工具，而是能夠「完成工作」的合作夥伴。這是一個從「邏輯編寫」轉向「上下文工程（Context Engineering）」的過程，核心在於如何策展 AI 的資訊視窗。

圖1：軟體開發的典範轉移：從被動工具到主動合作夥伴
圖片來源：Google (2025), Introduction to Agents，本文作者整理，並以AI生成

二、 Agent 的解剖學：構成自主系統的四大核心

要讓 AI 像員工一樣獨立工作，它不能只有大腦。Google 定義了 Agent 的四大核心組件，這構成了它的完整「身體構造」：

大腦（模型 Model）：負責推理、規劃與決策的核心。不同的任務可能需要不同大小的模型（如 Gemini Pro 或 Flash）來平衡成本與效能。
雙手（工具 Tools）：讓 Agent 能與真實世界互動的介面。這包括搜尋網路、讀取企業資料庫、執行程式碼或操作 API。
神經系統（協調層 Orchestration）：這是連接大腦與雙手的關鍵，負責管理記憶、規劃步驟（推理 → 行動 → 觀察的迴圈），並確保任務在軌道上運行。
身體（部署 Infrastructure）：Agent 運行的基礎設施，涉及安全性驗證、權限管理與擴展性。

圖2：Agent 的解剖學：模型、工具、協調層與部署
圖片來源： Google (2025), Introduction to Agents，本文作者整理，並以AI生成

三、你的 AI 在哪一級？代理系統的五級進化論

並非所有 Agent 都一樣強大。Google 提出了一個清晰的五層級分類，幫助企業評估自身的技術成熟度：

Level 0(第0級) – 核心推理系統：僅能依據訓練資料回答問題，無法聯網或使用工具（早期的 LLM）。
Level 1(第1級) – 互聯的問題解決者：AI 開始「長出雙手」，能呼叫外部工具或檢索即時資訊來回答問題。
Level 2 (第2級)- 策略性問題解決者：具備長期規劃能力，能將複雜問題拆解為多個步驟並依序執行。
Level 3(第3級) -協作式多代理系統：這是一個分水嶺。多個專精不同領域的 Agent 組成團隊，透過分工合作解決單一 Agent 無法處理的複雜任務。
Level 4 (第4級)- 自我演化代理：系統能自我學習、改進，甚至在發現能力不足時，自動生成新的工具或子 Agent 來解決問題。

目前大多數領先企業正處於從 Level 2 邁向 Level 3 的階段。

圖3：代理系統的能力分類學：從第0級到第4級
圖片來源：Google (2025), Introduction to Agents，本文作者整理，並以AI生成

四、 專家團隊模式：為什麼一個 Agent 不夠用？

你可能會問：「為什麼不訓練一個超級 Agent 做所有事？」答案是認知過載。就像人類一樣，如果要一個人同時當律師、工程師又當會計，效率必然低落。

最有效的架構是多代理協作（Multi-Agent Systems）。以「合規性查詢」為例，當用戶提出一個複雜的法規問題時，系統並不是由單一 Agent 硬答，而是啟動一個團隊：

協調器 Agent：擔任專案經理，負責拆解任務。
查詢分解 Agent：將大問題拆成多個搜尋關鍵字。
評論 Agent：負責審核蒐集到的資訊是否準確。
報告 Agent：將最終結果整合成易讀的報告。

這種分工模式不僅提高了準確度，還讓除錯變得更容易——如果報告寫得不好，你知道是「報告 Agent」的問題，而不是整個大腦壞了。

圖4：多代理協作架構實例：合規查詢的分工處理
圖片來源：Google (2025), Introduction to Agents，本文作者整理，並以AI生成

五、 連接萬物的標準：MCP 與 A2A 協定

當企業內部充滿了各種不同功能的 Agent，它們如何溝通？這需要共通語言。目前業界正形成三大互操作性支柱：

MCP (Model Context Protocol)：這是一種「USB 標準」，讓任何 AI 模型都能快速連接任何數據源或工具，無需為每個工具重新寫程式碼。
A2A (Agent2Agent)：這是 Agent 之間的通訊協定。就像交換名片一樣，Agent 透過交換「Agent Card」來宣告自己的能力，讓其他 Agent 知道何時該找它幫忙。
AP2 (Agent Payments Protocol)：為了讓 Agent 能執行商業交易（如訂票、採購），這是建立經濟信任與支付授權的協定。

圖5：互操作性三大支柱：MCP、A2A、AP2
圖片來源： Google (2025), Introduction to Agents，本文作者整理，並以AI生成

六、 Agent Ops：駕馭不可預測性的新營運思維

傳統軟體開發（DevOps）的測試邏輯很簡單：輸入 A，預期輸出 B，如果不一致就是 Bug。但在 AI Agent 的世界裡，同樣的輸入可能每次都會得到略有不同的回答，這種「機率性」讓傳統測試失效。

這時，企業需要建立全新的 Agent Ops 體系。這張圖表（圖 6）清楚展示了從 DevOps 到 MLOps，再到 GenAIOps 的演進關係。Agent Ops 引入了三個關鍵概念來確保系統穩定：

AI 評 AI（Evaluation）：既然人類無法一一審核，我們就用另一個強大的模型（LLM-as-a-Judge）來擔任裁判，評分 Agent 的回答是否準確、安全。
思考軌跡追蹤（Traces）：傳統 Log 只記錄結果，Agent Ops 則需要記錄「思考過程」——Agent 為什麼決定呼叫這個工具？它的推理邏輯是什麼？這對於除錯至關重要。
反饋迴圈（Feedback Loop）：將用戶的反饋與錯誤案例自動導回系統，成為新的測試資料集，讓 Agent 越用越聰明。

圖6：DevOps、MLOps 與 GenAIOps 的演進關係：針對 Agent 的行為監控與治理
圖片來源：Medium (2025), cited in Google, Introduction to Agents，本文作者整理，並以AI生成

七、 來自前瞻的案例：AI 共同科學家

這不是科幻小說，Google 的 AI Co-Scientist 已經在運作中。這是一個協助科學研究的多代理系統。

在這個系統中，有專門負責「文獻探索」的 Agent，有負責「模擬科學辯論」的反思 Agent，還有負責「生成研究假設」的 Agent。它們協同工作，不僅加速了文獻回顧的速度，還能提出人類科學家可能忽略的新穎假設。

圖7：AI 共同科學家的系統設計：多 Agent 協同進行假設生成與驗證
圖片來源：Google (2025), Introduction to Agents，本文作者整理，並以AI生成

給台灣企業決策者的行動建議

AI Agent 技術已經從實驗室走向應用層，這對企業意味著什麼？

重新思考「工作流程」而非「對話框」：不要只著眼於導入一個聊天機器人，而是檢視企業內部有哪些重複性高、規則明確的「流程」（如採購核銷、初級客服），這些是 Level 2 Agent 的最佳戰場。
資料治理是基本功：Agent 的能力取決於它能存取多少正確的資料。如果企業內部的資料是破碎、非結構化的（所謂的 Dumb Data），再聰明的 Agent 也會「巧婦難為無米之炊」。
擁抱「人機協作」的治理思維：Agent 雖然自主，但需要監督。建立 Agent Ops（代理營運體系）至關重要，確保有明確的護欄（Guardrails）防止 AI 做出越權或錯誤的決策。

AI 不會取代所有人類工作，但懂得運用 Agent 來組建「數位團隊」的企業，將在效率與創新上遙遙領先。

本文作者為資策會數位轉型研究院永續交通科技中心工程師董定融

分享這篇文章吧！

發表迴響取消回覆

探索更多來自 資策會數位轉型研究院 的內容

探索更多來自資策會數位轉型研究院的內容