Anthropic

Anthropic 自己做的 Agents

Claude Code、Computer Use、Claude Agent SDK——Anthropic 把 agent 概念做成的三個產品，怎麼選。

TL;DR

Claude Code：terminal-native coding agent，最成熟、Anthropic 自己工程師都用它寫 code
Computer Use：模型操作 GUI（滑鼠 + 鍵盤 + 截圖），目前還在 beta、production 要小心
Claude Agent SDK：把 agent loop / tools / state / hooks 抽成函式庫，90% 開發者其實不需要自己寫

一個情境：你想做一個會自己寫 PR 的 bot

需求：「Sentry 跳 error → 找出 stack trace 對應的 code → 修 bug → 開 PR」。

三個選項擺你面前：

自己用 Claude API 寫 agent loop（上一篇的做法）
直接用 Claude Code + Sentry MCP server（不用寫 agent，幾行設定搞定）
用 Claude Agent SDK 包一個 service

哪個對？大概率是 2。而且這就是這一篇要講的事：Anthropic 已經把最常見的 agent 場景做成產品了，先看能不能用，再考慮自己造。

三個產品的定位

	Claude Code	Computer Use	Claude Agent SDK
形式	Terminal CLI	API + 工具集	Python / TS 函式庫
場景	寫 code、debug、refactor	操作 GUI app、瀏覽器	自己組 agent service
介面	互動式對話	程式驅動	程式驅動
成熟度	GA	Beta	GA
自由度	中（內建 prompt + tool）	高	最高
適合	開發者日常	自動化 GUI 操作	客製化 agent 服務

Claude Code

跑在你 terminal 裡的 coding agent。內建工具：bash / read / write / edit / glob / grep / web fetch / MCP client。能讀整個 repo、跑測試、commit、開 PR——你給目標、它組合工具自己做完。

npm install -g @anthropic-ai/claude-code
claude  # 開始

特色：

/init 掃 codebase 寫成 CLAUDE.md 給未來 session 當 context
接 MCP server 擴充功能（Sentry、Jira、Figma、Slack…）
Plan mode、hooks、subagents、output styles 等進階控制

詳細介紹、設定、進階技巧請看 Claude Code 系列——這裡不重複。

Computer Use

Anthropic 在 2024 年釋出的工具集，讓 Claude 能：

看 screenshot
移動滑鼠 + 點擊
敲鍵盤輸入文字
跑 bash 指令

每個動作之後自動回傳 screenshot，這就是上一篇講的「環境感知」原型實作。可以拿來自動化「沒 API 的 GUI 應用」、「跑 web 測試」、「填表單」。

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    tools=[
        {"type": "computer_20250124", "name": "computer", ...},
        {"type": "bash_20250124", "name": "bash"},
    ],
    messages=[{"role": "user", "content": "打開 chrome 查最近 BTC 價格"}],
    betas=["computer-use-2025-01-24"],
)

Beta 警告：誤點、誤輸入、prompt injection（看到惡意網頁就被帶偏）的風險都實際存在。production 要在 sandbox VM / Docker 裡跑，不要直接給它操你的桌面。Anthropic 自己的 demo 也都跑在隔離容器裡。

Claude Agent SDK

把「自己寫 agent loop」這件事抽成函式庫——Anthropic 內部蓋 Claude Code 跟其他 agent 用的同一套底層，現在開源讓你也能用。

它幫你處理：

Agent loop（tool call → execute → feed back）
Tool 註冊跟執行
Conversation state 管理
Hooks / interception
Subagent orchestration

換句話說，上一篇的「LLM + tools + loop + stop」四件事它幫你包好。自己寫一遍當練習很值得，但 production 不用自己重造輪子。

自己做 vs 用 Anthropic 現成的

決策樹：

要做的事跟「寫 code」相關？
├─ Yes ──► Claude Code + MCP servers（90% 命中）
│         └─ 不夠用？─► Claude Agent SDK
└─ No ──► 是「操作 GUI / 沒 API 的服務」嗎？
          ├─ Yes ──► Computer Use（注意 beta + sandbox）
          └─ No ──► 自己用 Claude API + Section 4 + 8 從頭寫

「自己從頭寫」不是壞選擇——當你的 agent 有特殊的 UX、特殊的 tool registry、特殊的 budget control、要嵌進現有產品時，自己寫反而比硬把產品塞進別人的框架快。

課程到這裡

從第一個 messages.create 走到 agent，這一系列用 8 個 section 把 production LLM 系統的工程基礎都鋪過一遍：

存取 API — message 結構、temperature、structured output
Prompt eval — 沒 eval 的 prompt engineering 就是猜
Prompt engineering — 基於 eval 的迭代
Tool use — Claude 連外部世界
RAG — 公司知識庫接進來
進階能力 — caching、thinking、vision、citations
MCP — 標準化 tool 接法
Agents & workflows — 把上面的元件組成會自己做事的系統

最大心得只有一個：先用 workflow 把確定的部分 lock 住，讓 agent 只負責真的需要動態決策的那一段。

下一步

接下來建議的方向：

深入 MCP 系列——學會自己寫 MCP server，agent 的 tool 來源就無上限
深入 Claude Code 系列——hooks、subagents、SDK、custom commands，把日常工作流交給它
自己組一個 agent loop——拿 Section 4 tool use + 這節 workflow patterns 當基礎，做一個解決你自己問題的小 agent。寫一次比讀十篇文章都有感
沒涵蓋到值得自學的主題：agent orchestration（多 agent 協作）、agent eval / observability、agentic RAG、tool description eval

謝謝你跟到這裡。LLM 工程不是看完課就結束。把學到的東西丟進你正在做的專案裡撞牆，撞完回來再讀一次，每次理解都不一樣。