Applied AI School
v0 · 規劃中
Anthropic

Anthropic 自己做的 Agents

Claude Code、Computer Use、Claude Agent SDK——Anthropic 把 agent 概念做成的三個產品,怎麼選。

TL;DR

  • Claude Code:terminal-native coding agent,最成熟、Anthropic 自己工程師都用它寫 code
  • Computer Use:模型操作 GUI(滑鼠 + 鍵盤 + 截圖),目前還在 beta、production 要小心
  • Claude Agent SDK:把 agent loop / tools / state / hooks 抽成函式庫,90% 開發者其實不需要自己寫

一個情境:你想做一個會自己寫 PR 的 bot

需求:「Sentry 跳 error → 找出 stack trace 對應的 code → 修 bug → 開 PR」。

三個選項擺你面前:

  1. 自己用 Claude API 寫 agent loop上一篇的做法)
  2. 直接用 Claude Code + Sentry MCP server(不用寫 agent,幾行設定搞定)
  3. 用 Claude Agent SDK 包一個 service

哪個對?大概率是 2。而且這就是這一篇要講的事:Anthropic 已經把最常見的 agent 場景做成產品了,先看能不能用,再考慮自己造

三個產品的定位

Claude CodeComputer UseClaude Agent SDK
形式Terminal CLIAPI + 工具集Python / TS 函式庫
場景寫 code、debug、refactor操作 GUI app、瀏覽器自己組 agent service
介面互動式對話程式驅動程式驅動
成熟度GABetaGA
自由度中(內建 prompt + tool)最高
適合開發者日常自動化 GUI 操作客製化 agent 服務

Claude Code

跑在你 terminal 裡的 coding agent。內建工具:bash / read / write / edit / glob / grep / web fetch / MCP client。能讀整個 repo、跑測試、commit、開 PR——你給目標、它組合工具自己做完。

npm install -g @anthropic-ai/claude-code
claude  # 開始

特色:

  • /init 掃 codebase 寫成 CLAUDE.md 給未來 session 當 context
  • 接 MCP server 擴充功能(Sentry、Jira、Figma、Slack…)
  • Plan mode、hooks、subagents、output styles 等進階控制

詳細介紹、設定、進階技巧請看 Claude Code 系列——這裡不重複。

Computer Use

Anthropic 在 2024 年釋出的工具集,讓 Claude 能:

  • 看 screenshot
  • 移動滑鼠 + 點擊
  • 敲鍵盤輸入文字
  • 跑 bash 指令

每個動作之後自動回傳 screenshot,這就是 上一篇 講的「環境感知」原型實作。可以拿來自動化「沒 API 的 GUI 應用」、「跑 web 測試」、「填表單」。

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    tools=[
        {"type": "computer_20250124", "name": "computer", ...},
        {"type": "bash_20250124", "name": "bash"},
    ],
    messages=[{"role": "user", "content": "打開 chrome 查最近 BTC 價格"}],
    betas=["computer-use-2025-01-24"],
)

Beta 警告:誤點、誤輸入、prompt injection(看到惡意網頁就被帶偏)的風險都實際存在。production 要在 sandbox VM / Docker 裡跑,不要直接給它操你的桌面。Anthropic 自己的 demo 也都跑在隔離容器裡。

Claude Agent SDK

把「自己寫 agent loop」這件事抽成函式庫——Anthropic 內部蓋 Claude Code 跟其他 agent 用的同一套底層,現在開源讓你也能用。

它幫你處理:

  • Agent loop(tool call → execute → feed back)
  • Tool 註冊跟執行
  • Conversation state 管理
  • Hooks / interception
  • Subagent orchestration

換句話說,上一篇 的「LLM + tools + loop + stop」四件事它幫你包好。自己寫一遍當練習很值得,但 production 不用自己重造輪子

自己做 vs 用 Anthropic 現成的

決策樹:

要做的事跟「寫 code」相關?
├─ Yes ──► Claude Code + MCP servers(90% 命中)
│         └─ 不夠用?─► Claude Agent SDK
└─ No ──► 是「操作 GUI / 沒 API 的服務」嗎?
          ├─ Yes ──► Computer Use(注意 beta + sandbox)
          └─ No ──► 自己用 Claude API + Section 4 + 8 從頭寫

「自己從頭寫」不是壞選擇——當你的 agent 有特殊的 UX、特殊的 tool registry、特殊的 budget control、要嵌進現有產品時,自己寫反而比硬把產品塞進別人的框架快。

課程到這裡

從第一個 messages.create 走到 agent,這一系列用 8 個 section 把 production LLM 系統的工程基礎都鋪過一遍:

  1. 存取 API — message 結構、temperature、structured output
  2. Prompt eval — 沒 eval 的 prompt engineering 就是猜
  3. Prompt engineering — 基於 eval 的迭代
  4. Tool use — Claude 連外部世界
  5. RAG — 公司知識庫接進來
  6. 進階能力 — caching、thinking、vision、citations
  7. MCP — 標準化 tool 接法
  8. Agents & workflows — 把上面的元件組成會自己做事的系統

最大心得只有一個:先用 workflow 把確定的部分 lock 住,讓 agent 只負責真的需要動態決策的那一段

下一步

接下來建議的方向:

  • 深入 MCP 系列——學會自己寫 MCP server,agent 的 tool 來源就無上限
  • 深入 Claude Code 系列——hooks、subagents、SDK、custom commands,把日常工作流交給它
  • 自己組一個 agent loop——拿 Section 4 tool use + 這節 workflow patterns 當基礎,做一個解決你自己問題的小 agent。寫一次比讀十篇文章都有感
  • 沒涵蓋到值得自學的主題:agent orchestration(多 agent 協作)、agent eval / observability、agentic RAG、tool description eval

謝謝你跟到這裡。LLM 工程不是看完課就結束。把學到的東西丟進你正在做的專案裡撞牆,撞完回來再讀一次,每次理解都不一樣。