AI時代不可不知!AI Agent 架構全解析:從 Google 白皮書到企業落地的技術藍圖

2025 年末,Google 發布「Introduction to Agents」白皮書,標誌著 AI 正從被動的聊天機器人邁向自主代理系統(AI Agents)。這場典範轉移將如何改變企業運作?本文深入剖析 AI Agent 的四大核心架構、五級能力指標、關鍵的 Agent Ops 營運體系,以及企業落地的關鍵策略。


一、 軟體開發的典範轉移:從「砌磚工」到「導演」

人工智慧正經歷一場根本性的轉變。過去幾年,我們熟悉的 AI(如早期的 ChatGPT)主要屬於預測式 AI。Google 白皮書將這種開發模式比喻為「砌磚工(The Bricklayer)」——開發者必須明確定義每一行程式碼的邏輯,告訴 AI 每一步該怎麼做。

如今,我們正進入代理式 AIAgentic AI 的時代。這時的開發者更像是一位「導演(The Director)」。你不再需要微管理每一個步驟,而是設定場景(環境)、選角(工具)、給予劇本(目標),然後讓 AI Agent 自主規劃路徑、解決問題並應對突發狀況。

這種轉變意味著 AI 不再只是「回答問題」的工具,而是能夠「完成工作」的合作夥伴。這是一個從「邏輯編寫」轉向「上下文工程(Context Engineering)」的過程,核心在於如何策展 AI 的資訊視窗。

圖1:軟體開發的典範轉移:從被動工具到主動合作夥伴
圖片來源:Google (2025), Introduction to Agents,本文作者整理,並以AI生成

二、 Agent 的解剖學:構成自主系統的四大核心

要讓 AI 像員工一樣獨立工作,它不能只有大腦。Google 定義了 Agent 的四大核心組件,這構成了它的完整「身體構造」:

  1. 大腦(模型 Model:負責推理、規劃與決策的核心。不同的任務可能需要不同大小的模型(如 Gemini Pro 或 Flash)來平衡成本與效能。
  2. 雙手(工具 Tools:讓 Agent 能與真實世界互動的介面。這包括搜尋網路、讀取企業資料庫、執行程式碼或操作 API。
  3. 神經系統(協調層 Orchestration:這是連接大腦與雙手的關鍵,負責管理記憶、規劃步驟(推理 → 行動 → 觀察的迴圈),並確保任務在軌道上運行。
  4. 身體(部署 Infrastructure:Agent 運行的基礎設施,涉及安全性驗證、權限管理與擴展性。
圖2:Agent 的解剖學:模型、工具、協調層與部署
圖片來源: Google (2025), Introduction to Agents,本文作者整理,並以AI生成

三、 你的 AI 在哪一級?代理系統的五級進化論

並非所有 Agent 都一樣強大。Google 提出了一個清晰的五層級分類,幫助企業評估自身的技術成熟度:

  • Level 0(第0級) – 核心推理系統:僅能依據訓練資料回答問題,無法聯網或使用工具(早期的 LLM)。
  • Level 1(第1級) – 互聯的問題解決者:AI 開始「長出雙手」,能呼叫外部工具或檢索即時資訊來回答問題。
  • Level 2 (第2級)- 策略性問題解決者:具備長期規劃能力,能將複雜問題拆解為多個步驟並依序執行。
  • Level 3(第3級) -協作式多代理系統:這是一個分水嶺。多個專精不同領域的 Agent 組成團隊,透過分工合作解決單一 Agent 無法處理的複雜任務。
  • Level 4 (第4級)- 自我演化代理:系統能自我學習、改進,甚至在發現能力不足時,自動生成新的工具或子 Agent 來解決問題。

目前大多數領先企業正處於從 Level 2 邁向 Level 3 的階段。

圖3:代理系統的能力分類學:從第0級到第4級
圖片來源:Google (2025), Introduction to Agents,本文作者整理,並以AI生成

四、 專家團隊模式:為什麼一個 Agent 不夠用?

你可能會問:「為什麼不訓練一個超級 Agent 做所有事?」答案是認知過載。就像人類一樣,如果要一個人同時當律師、工程師又當會計,效率必然低落。

最有效的架構是多代理協作(Multi-Agent Systems。以「合規性查詢」為例,當用戶提出一個複雜的法規問題時,系統並不是由單一 Agent 硬答,而是啟動一個團隊:

  1. 協調器 Agent:擔任專案經理,負責拆解任務。
  2. 查詢分解 Agent:將大問題拆成多個搜尋關鍵字。
  3. 評論 Agent:負責審核蒐集到的資訊是否準確。
  4. 報告 Agent:將最終結果整合成易讀的報告。

這種分工模式不僅提高了準確度,還讓除錯變得更容易——如果報告寫得不好,你知道是「報告 Agent」的問題,而不是整個大腦壞了。

圖4:多代理協作架構實例:合規查詢的分工處理
圖片來源:Google (2025), Introduction to Agents,本文作者整理,並以AI生成

五、 連接萬物的標準:MCP A2A 協定

當企業內部充滿了各種不同功能的 Agent,它們如何溝通?這需要共通語言。目前業界正形成三大互操作性支柱:

  • MCP (Model Context Protocol):這是一種「USB 標準」,讓任何 AI 模型都能快速連接任何數據源或工具,無需為每個工具重新寫程式碼。
  • A2A (Agent2Agent):這是 Agent 之間的通訊協定。就像交換名片一樣,Agent 透過交換「Agent Card」來宣告自己的能力,讓其他 Agent 知道何時該找它幫忙。
  • AP2 (Agent Payments Protocol):為了讓 Agent 能執行商業交易(如訂票、採購),這是建立經濟信任與支付授權的協定。
圖5:互操作性三大支柱:MCP、A2A、AP2
圖片來源: Google (2025), Introduction to Agents,本文作者整理,並以AI生成

六、 Agent Ops:駕馭不可預測性的新營運思維

傳統軟體開發(DevOps)的測試邏輯很簡單:輸入 A,預期輸出 B,如果不一致就是 Bug。但在 AI Agent 的世界裡,同樣的輸入可能每次都會得到略有不同的回答,這種「機率性」讓傳統測試失效。

這時,企業需要建立全新的 Agent Ops 體系。這張圖表(圖 6)清楚展示了從 DevOps 到 MLOps,再到 GenAIOps 的演進關係。Agent Ops 引入了三個關鍵概念來確保系統穩定:

  1. AI AIEvaluation:既然人類無法一一審核,我們就用另一個強大的模型(LLM-as-a-Judge)來擔任裁判,評分 Agent 的回答是否準確、安全。
  2. 思考軌跡追蹤(Traces:傳統 Log 只記錄結果,Agent Ops 則需要記錄「思考過程」——Agent 為什麼決定呼叫這個工具?它的推理邏輯是什麼?這對於除錯至關重要。
  3. 反饋迴圈(Feedback Loop):將用戶的反饋與錯誤案例自動導回系統,成為新的測試資料集,讓 Agent 越用越聰明。
圖6:DevOps、MLOps 與 GenAIOps 的演進關係:針對 Agent 的行為監控與治理
圖片來源:Medium (2025), cited in Google, Introduction to Agents,本文作者整理,並以AI生成

七、 來自前瞻的案例:AI 共同科學家

這不是科幻小說,Google 的 AI Co-Scientist 已經在運作中。這是一個協助科學研究的多代理系統。

在這個系統中,有專門負責「文獻探索」的 Agent,有負責「模擬科學辯論」的反思 Agent,還有負責「生成研究假設」的 Agent。它們協同工作,不僅加速了文獻回顧的速度,還能提出人類科學家可能忽略的新穎假設。

圖7:AI 共同科學家的系統設計:多 Agent 協同進行假設生成與驗證
圖片來源:Google (2025), Introduction to Agents,本文作者整理,並以AI生成

給台灣企業決策者的行動建議

AI Agent 技術已經從實驗室走向應用層,這對企業意味著什麼?

  1. 重新思考「工作流程」而非「對話框」:不要只著眼於導入一個聊天機器人,而是檢視企業內部有哪些重複性高、規則明確的「流程」(如採購核銷、初級客服),這些是 Level 2 Agent 的最佳戰場。
  2. 資料治理是基本功:Agent 的能力取決於它能存取多少正確的資料。如果企業內部的資料是破碎、非結構化的(所謂的 Dumb Data),再聰明的 Agent 也會「巧婦難為無米之炊」。
  3. 擁抱「人機協作」的治理思維:Agent 雖然自主,但需要監督。建立 Agent Ops(代理營運體系)至關重要,確保有明確的護欄(Guardrails)防止 AI 做出越權或錯誤的決策。

AI 不會取代所有人類工作,但懂得運用 Agent 來組建「數位團隊」的企業,將在效率與創新上遙遙領先。

本文作者為資策會數位轉型研究院永續交通科技中心工程師董定融

發表迴響取消回覆