Anthropic 自己做的 Agents
Claude Code、Computer Use、Claude Agent SDK——Anthropic 把 agent 概念做成的三個產品,怎麼選。
TL;DR
- Claude Code:terminal-native coding agent,最成熟、Anthropic 自己工程師都用它寫 code
- Computer Use:模型操作 GUI(滑鼠 + 鍵盤 + 截圖),目前還在 beta、production 要小心
- Claude Agent SDK:把 agent loop / tools / state / hooks 抽成函式庫,90% 開發者其實不需要自己寫
一個情境:你想做一個會自己寫 PR 的 bot
需求:「Sentry 跳 error → 找出 stack trace 對應的 code → 修 bug → 開 PR」。
三個選項擺你面前:
- 自己用 Claude API 寫 agent loop(上一篇的做法)
- 直接用 Claude Code + Sentry MCP server(不用寫 agent,幾行設定搞定)
- 用 Claude Agent SDK 包一個 service
哪個對?大概率是 2。而且這就是這一篇要講的事:Anthropic 已經把最常見的 agent 場景做成產品了,先看能不能用,再考慮自己造。
三個產品的定位
| Claude Code | Computer Use | Claude Agent SDK | |
|---|---|---|---|
| 形式 | Terminal CLI | API + 工具集 | Python / TS 函式庫 |
| 場景 | 寫 code、debug、refactor | 操作 GUI app、瀏覽器 | 自己組 agent service |
| 介面 | 互動式對話 | 程式驅動 | 程式驅動 |
| 成熟度 | GA | Beta | GA |
| 自由度 | 中(內建 prompt + tool) | 高 | 最高 |
| 適合 | 開發者日常 | 自動化 GUI 操作 | 客製化 agent 服務 |
Claude Code
跑在你 terminal 裡的 coding agent。內建工具:bash / read / write / edit / glob / grep / web fetch / MCP client。能讀整個 repo、跑測試、commit、開 PR——你給目標、它組合工具自己做完。
npm install -g @anthropic-ai/claude-code
claude # 開始
特色:
/init掃 codebase 寫成CLAUDE.md給未來 session 當 context- 接 MCP server 擴充功能(Sentry、Jira、Figma、Slack…)
- Plan mode、hooks、subagents、output styles 等進階控制
詳細介紹、設定、進階技巧請看 Claude Code 系列——這裡不重複。
Computer Use
Anthropic 在 2024 年釋出的工具集,讓 Claude 能:
- 看 screenshot
- 移動滑鼠 + 點擊
- 敲鍵盤輸入文字
- 跑 bash 指令
每個動作之後自動回傳 screenshot,這就是 上一篇 講的「環境感知」原型實作。可以拿來自動化「沒 API 的 GUI 應用」、「跑 web 測試」、「填表單」。
response = client.beta.messages.create(
model="claude-sonnet-4-6",
tools=[
{"type": "computer_20250124", "name": "computer", ...},
{"type": "bash_20250124", "name": "bash"},
],
messages=[{"role": "user", "content": "打開 chrome 查最近 BTC 價格"}],
betas=["computer-use-2025-01-24"],
)
Beta 警告:誤點、誤輸入、prompt injection(看到惡意網頁就被帶偏)的風險都實際存在。production 要在 sandbox VM / Docker 裡跑,不要直接給它操你的桌面。Anthropic 自己的 demo 也都跑在隔離容器裡。
Claude Agent SDK
把「自己寫 agent loop」這件事抽成函式庫——Anthropic 內部蓋 Claude Code 跟其他 agent 用的同一套底層,現在開源讓你也能用。
它幫你處理:
- Agent loop(tool call → execute → feed back)
- Tool 註冊跟執行
- Conversation state 管理
- Hooks / interception
- Subagent orchestration
換句話說,上一篇 的「LLM + tools + loop + stop」四件事它幫你包好。自己寫一遍當練習很值得,但 production 不用自己重造輪子。
自己做 vs 用 Anthropic 現成的
決策樹:
要做的事跟「寫 code」相關?
├─ Yes ──► Claude Code + MCP servers(90% 命中)
│ └─ 不夠用?─► Claude Agent SDK
└─ No ──► 是「操作 GUI / 沒 API 的服務」嗎?
├─ Yes ──► Computer Use(注意 beta + sandbox)
└─ No ──► 自己用 Claude API + Section 4 + 8 從頭寫
「自己從頭寫」不是壞選擇——當你的 agent 有特殊的 UX、特殊的 tool registry、特殊的 budget control、要嵌進現有產品時,自己寫反而比硬把產品塞進別人的框架快。
課程到這裡
從第一個 messages.create 走到 agent,這一系列用 8 個 section 把 production LLM 系統的工程基礎都鋪過一遍:
- 存取 API — message 結構、temperature、structured output
- Prompt eval — 沒 eval 的 prompt engineering 就是猜
- Prompt engineering — 基於 eval 的迭代
- Tool use — Claude 連外部世界
- RAG — 公司知識庫接進來
- 進階能力 — caching、thinking、vision、citations
- MCP — 標準化 tool 接法
- Agents & workflows — 把上面的元件組成會自己做事的系統
最大心得只有一個:先用 workflow 把確定的部分 lock 住,讓 agent 只負責真的需要動態決策的那一段。
下一步
接下來建議的方向:
- 深入 MCP 系列——學會自己寫 MCP server,agent 的 tool 來源就無上限
- 深入 Claude Code 系列——hooks、subagents、SDK、custom commands,把日常工作流交給它
- 自己組一個 agent loop——拿 Section 4 tool use + 這節 workflow patterns 當基礎,做一個解決你自己問題的小 agent。寫一次比讀十篇文章都有感
- 沒涵蓋到值得自學的主題:agent orchestration(多 agent 協作)、agent eval / observability、agentic RAG、tool description eval
謝謝你跟到這裡。LLM 工程不是看完課就結束。把學到的東西丟進你正在做的專案裡撞牆,撞完回來再讀一次,每次理解都不一樣。

