spinny:~/writing $ less building-ai-agents-claude-agent-sdk.md
12Das Claude Agent SDK bietet programmatischen Zugriff auf dieselbe Agent-Loop, die Claude Code antreibt. Deine Agenten koennen Dateien lesen, Shell-Befehle ausfuehren, das Web durchsuchen, Code bearbeiten, externe APIs ueber MCP-Server aufrufen und Sub-Agenten orchestrieren - alles mit wenigen Zeilen TypeScript oder Python.34Im Gegensatz zum Standard Anthropic Client SDK, bei dem du deine eigene Tool-Loop baust, uebernimmt das Agent SDK die Tool-Ausfuehrung, das Kontextmanagement, Wiederholungsversuche und die Orchestrierung intern. Du beschreibst, was du willst, stellst die Tools bereit, und der Agent erledigt den Rest.56## Architektur78Das SDK folgt einer einfachen Schleife: **Kontext sammeln, handeln, verifizieren, wiederholen**.910```mermaid11graph TD12 Input[User Prompt] --> Loop[Agent Loop]13 Loop --> Reason[Claude Reasons]14 Reason --> Tool[Call Tool]15 Tool --> Result[Tool Result]16 Result --> Loop17 Reason --> Done[Final Response]1819 subgraph "Built-in Tools"20 T1[Read / Write / Edit]21 T2[Bash / Terminal]22 T3[Glob / Grep]23 T4[WebSearch / WebFetch]24 end2526 subgraph "Custom Tools via MCP"27 M1[Your API]28 M2[Database]29 M3[Slack / GitHub / etc.]30 end3132 Tool --> T133 Tool --> M134```3536Der zentrale Einstiegspunkt ist `query()`, das einen asynchronen Iterator zurueckgibt, der Nachrichten streamt, waehrend der Agent arbeitet. Jede Nachricht zeigt dir, was der Agent gerade tut: denken, ein Tool aufrufen, ein Ergebnis empfangen oder die finale Ausgabe liefern.3738## Erste Schritte3940### Installation4142```bash43# TypeScript44npm install @anthropic-ai/claude-agent-sdk4546# Python47pip install claude-agent-sdk48```4950Du brauchst einen Anthropic API Key, der als `ANTHROPIC_API_KEY` in deiner Umgebung gesetzt ist.5152### Dein erster Agent5354```typescript55import { query } from "@anthropic-ai/claude-agent-sdk";5657const conversation = query({58 prompt: "Find all TODO comments in the codebase and create a summary",59 options: {60 allowedTools: ["Read", "Glob", "Grep"],61 },62});6364for await (const message of conversation) {65 if (message.type === "assistant") {66 process.stdout.write(message.content);67 }68 if (message.type === "result" && message.subtype === "success") {69 console.log("\nDone:", message.result);70 }71}72```7374Das war's. Der Agent wird Glob verwenden, um Dateien zu finden, Grep, um nach TODO-Mustern zu suchen, Read, um Treffer zu inspizieren, und eine strukturierte Zusammenfassung zurueckgeben. Du schreibst nicht die Orchestrierungslogik - das SDK uebernimmt das.7576### Python-Aequivalent7778```python79from claude_agent_sdk import query8081async for message in query(82 prompt="Find all TODO comments in the codebase and create a summary",83 options={"allowed_tools": ["Read", "Glob", "Grep"]},84):85 if message.type == "assistant":86 print(message.content, end="")87 if message.type == "result" and message.subtype == "success":88 print(f"\nDone: {message.result}")89```9091## Integrierte Tools9293Das SDK wird mit denselben Tools ausgeliefert, die in Claude Code verfuegbar sind:9495| Tool | Beschreibung |96|------|-------------|97| **Read** | Dateiinhalte lesen |98| **Write** | Neue Dateien erstellen |99| **Edit** | Gezielte Aenderungen an bestehenden Dateien vornehmen |100| **Bash** | Shell-Befehle ausfuehren |101| **Glob** | Dateien nach Muster finden |102| **Grep** | Dateiinhalte mit Regex durchsuchen |103| **WebSearch** | Das Web durchsuchen |104| **WebFetch** | Eine URL abrufen und deren Inhalt zurueckgeben |105| **AskUserQuestion** | Den Benutzer um Eingabe bitten |106107Du steuerst ueber `allowedTools`, welche Tools der Agent verwenden darf. Wenn ein Tool nicht in der Liste steht, kann der Agent es nicht aufrufen.108109## Berechtigungsmodi110111Da Agenten echte Befehle auf echten Systemen ausfuehren, sind Berechtigungen wichtig.112113| Modus | Verhalten | Anwendungsfall |114|------|----------|----------|115| `default` | Benutzerdefinierter `canUseTool`-Callback entscheidet pro Aufruf | Feingranulare Kontrolle |116| `acceptEdits` | Dateioperationen automatisch genehmigen, bei Bash nachfragen | Entwicklungs-Workflows |117| `dontAsk` | Alles ablehnen, was nicht in allowedTools steht | Eingeschraenkte Agenten |118| `bypassPermissions` | Alles automatisch genehmigen | Vertrauenswuerdige Sandbox-Umgebungen |119| `auto` | Modell-Klassifizierer entscheidet ueber Sicherheit | Ausgewogene Automatisierung |120121```typescript122const conversation = query({123 prompt: "Refactor the auth module to use JWT",124 options: {125 allowedTools: ["Read", "Edit", "Glob", "Grep", "Bash"],126 permissionMode: "acceptEdits",127 },128});129```130131Fuer den Produktiveinsatz solltest du Agenten immer in Sandbox-Umgebungen (Container, VMs) ausfuehren und den restriktivsten Berechtigungsmodus verwenden, der dem Agenten noch erlaubt, seine Aufgabe zu erledigen.132133## Eigene Tools mit MCP erstellen134135Die wahre Staerke des SDK liegt in der Erweiterung von Agenten mit eigenen Tools. Eigene Tools werden als In-Process-MCP-Server definiert - kein Subprozess-Management, kein Netzwerk-Overhead.136137### Beispiel: Wetter-Tool138139```typescript140import { tool, createSdkMcpServer, query } from "@anthropic-ai/claude-agent-sdk";141import { z } from "zod";142143const getTemperature = tool(144 "get_temperature",145 "Get the current temperature at a location",146 {147 latitude: z.number().describe("Latitude"),148 longitude: z.number().describe("Longitude"),149 },150 async ({ latitude, longitude }) => {151 const res = await fetch(152 `https://api.open-meteo.com/v1/forecast?latitude=${latitude}&longitude=${longitude}¤t=temperature_2m&temperature_unit=celsius`153 );154 const data = await res.json();155 return {156 content: [157 {158 type: "text",159 text: `Current temperature: ${data.current.temperature_2m}C`,160 },161 ],162 };163 }164);165166const weatherServer = createSdkMcpServer({167 name: "weather",168 version: "1.0.0",169 tools: [getTemperature],170});171172for await (const message of query({173 prompt: "What's the weather like in Rome?",174 options: {175 mcpServers: { weather: weatherServer },176 allowedTools: ["mcp__weather__get_temperature"],177 },178})) {179 if (message.type === "result" && message.subtype === "success") {180 console.log(message.result);181 }182}183```184185Eigene Tools folgen der Namenskonvention `mcp__{server_name}__{tool_name}`. Du kannst Wildcards in `allowedTools` verwenden: `"mcp__weather__*"` erlaubt alle Tools vom Wetter-Server.186187### Beispiel: Datenbank-Abfrage-Tool188189```typescript190const queryDb = tool(191 "query_database",192 "Run a read-only SQL query against the application database",193 {194 sql: z.string().describe("SQL SELECT query to execute"),195 },196 async ({ sql }) => {197 // Validate: only allow SELECT queries198 if (!sql.trim().toUpperCase().startsWith("SELECT")) {199 return {200 content: [{ type: "text", text: "Error: Only SELECT queries are allowed." }],201 };202 }203204 const result = await pool.query(sql);205 return {206 content: [207 {208 type: "text",209 text: JSON.stringify(result.rows, null, 2),210 },211 ],212 };213 }214);215```216217## Externe MCP-Server verbinden218219Ueber In-Process-Tools hinaus kannst du dich mit jedem bestehenden MCP-Server verbinden - dieselben Server, die mit Claude Desktop, Cursor und anderen MCP-Clients funktionieren.220221```typescript222for await (const message of query({223 prompt: "Check the latest issues in the frontend repo and summarize them",224 options: {225 mcpServers: {226 github: {227 command: "npx",228 args: ["-y", "@modelcontextprotocol/server-github"],229 env: { GITHUB_PERSONAL_ACCESS_TOKEN: process.env.GITHUB_TOKEN },230 },231 },232 allowedTools: ["mcp__github__*"],233 },234})) {235 // ...236}237```238239Du kannst mehrere MCP-Server kombinieren. Der Agent sieht alle Tools von allen verbundenen Servern und nutzt sie nach Bedarf.240241```mermaid242graph LR243 Agent[Your Agent] --> SDK[Agent SDK]244 SDK --> InProcess[In-process MCP\nCustom Tools]245 SDK --> GitHub[GitHub MCP Server]246 SDK --> Postgres[PostgreSQL MCP Server]247 SDK --> Slack[Slack MCP Server]248```249250## Multi-Agent-Orchestrierung251252Fuer komplexe Workflows kannst du spezialisierte Sub-Agenten definieren, an die der uebergeordnete Agent Aufgaben delegiert. Jeder Sub-Agent hat seinen eigenen Prompt, seine eigenen Tools und seinen eigenen Fokusbereich.253254```typescript255for await (const message of query({256 prompt: "Review the PR, check for security issues, and update the changelog",257 options: {258 allowedTools: ["Read", "Edit", "Bash", "Glob", "Grep", "Agent"],259 agents: [260 {261 name: "security-reviewer",262 description: "Reviews code for security vulnerabilities",263 prompt: "You are a security expert. Analyze code for OWASP Top 10 vulnerabilities.",264 allowedTools: ["Read", "Glob", "Grep"],265 },266 {267 name: "changelog-writer",268 description: "Updates the CHANGELOG.md file based on recent changes",269 prompt: "You maintain the project changelog. Follow Keep a Changelog format.",270 allowedTools: ["Read", "Edit", "Bash"],271 },272 ],273 },274})) {275 // The parent agent will:276 // 1. Read the PR diff277 // 2. Delegate security review to security-reviewer278 // 3. Delegate changelog update to changelog-writer279 // 4. Synthesize results280}281```282283Fuege `"Agent"` in die `allowedTools` des uebergeordneten Agenten ein, um Delegation zu ermoeglichen. Sub-Agenten laufen mit ihren eigenen Tools und koennen nicht auf die Tools des uebergeordneten Agenten zugreifen, es sei denn, dies wird explizit erlaubt.284285```mermaid286graph TD287 Parent[Parent Agent] --> SR[Security Reviewer\nRead, Glob, Grep]288 Parent --> CW[Changelog Writer\nRead, Edit, Bash]289 SR --> Report[Security Report]290 CW --> Updated[Updated CHANGELOG]291 Report --> Parent292 Updated --> Parent293 Parent --> Final[Final Summary]294```295296## Sessions und Kontinuitaet297298Agenten koennen ueber mehrere Abfragen hinweg den Kontext beibehalten, indem sie Sessions verwenden. Erfasse die `session_id` aus der ersten Interaktion und uebergib sie in `resume` fuer nachfolgende Abfragen.299300```typescript301let sessionId: string | undefined;302303// First query304for await (const message of query({305 prompt: "Read the project structure and understand the architecture",306 options: { allowedTools: ["Read", "Glob", "Grep"] },307})) {308 if (message.type === "init") {309 sessionId = message.session_id;310 }311}312313// Follow-up query (same session, full context preserved)314for await (const message of query({315 prompt: "Now refactor the auth module based on what you learned",316 resume: sessionId,317 options: { allowedTools: ["Read", "Edit", "Bash"] },318})) {319 // Agent remembers the full project context from the first query320}321```322323## Claude Managed Agents324325Wenn du die Agent-Infrastruktur nicht selbst hosten moechtest, bietet **Claude Managed Agents** (gestartet im April 2026) einen vollstaendig verwalteten Cloud-Service. Anthropic betreibt die Container, kuemmert sich um die Skalierung und stellt eine Streaming-API bereit.326327```mermaid328graph LR329 subgraph "Self-hosted (Agent SDK)"330 Code[Your Code] --> SDK2[Agent SDK]331 SDK2 --> API[Claude API]332 SDK2 --> Tools[Your Tools]333 end334335 subgraph "Managed Agents"336 App[Your App] --> MAPI[Managed Agents API]337 MAPI --> Container[Anthropic-hosted Container]338 Container --> API2[Claude API]339 Container --> Tools2[Tools in Container]340 end341```342343Der wesentliche Unterschied: Mit dem Agent SDK fuehrst du die Agent-Loop in deiner eigenen Infrastruktur aus. Mit Managed Agents hostet und betreibt Anthropic den Agenten fuer dich. Du interagierst ueber eine session-basierte API und empfaengst Events ueber Server-Sent Events.344345**Preise:**346- **Agent SDK**: Nur die Standard-Claude-API-Tokenpreise. Du uebernimmst das Hosting.347- **Managed Agents**: Tokenpreise plus 0,08 $ pro Session-Stunde (millisekundengenau abgerechnet).348349## Best Practices fuer den Produktiveinsatz350351### 1. Immer sandboxen352353Fuehre Agenten niemals mit uneingeschraenkten Berechtigungen auf einem Produktionsrechner aus. Verwende Container (Docker, Fly.io, Modal) oder Sandbox-Umgebungen (E2B, Vercel Sandbox).354355### 2. Tool-Zugriff einschraenken356357Folge dem Prinzip der minimalen Berechtigung. Ein Agent, der Berichte generiert, braucht weder `Bash` noch `Write`.358359```typescript360// Too permissive361allowedTools: ["Read", "Write", "Edit", "Bash", "Glob", "Grep"]362363// Better: only what's needed364allowedTools: ["Read", "Glob", "Grep"]365```366367### 3. Hooks fuer Leitplanken nutzen368369Hooks ermoeglichen es dir, Tool-Aufrufe vor und nach der Ausfuehrung abzufangen. Nutze sie fuer Logging, Validierung und Rate Limiting.370371```typescript372const conversation = query({373 prompt: "Analyze the codebase",374 options: {375 allowedTools: ["Read", "Glob", "Grep"],376 hooks: {377 PreToolUse: async (toolName, input) => {378 console.log(`Tool call: ${toolName}`, input);379 // Return false to block the call380 if (toolName === "Bash" && input.command.includes("rm")) {381 return false;382 }383 return true;384 },385 },386 },387});388```389390### 4. Fehler angemessen behandeln391392Die Agent-Loop kann Fehler erzeugen - Tool-Fehler, API-Rate-Limits, Context-Window-Ueberlauf. Pruefe immer die Nachrichtentypen.393394```typescript395for await (const message of conversation) {396 switch (message.type) {397 case "assistant":398 // Agent reasoning399 break;400 case "tool_use":401 // Agent is calling a tool402 break;403 case "result":404 if (message.subtype === "error") {405 console.error("Agent failed:", message.error);406 }407 break;408 }409}410```411412### 5. Token-Verbrauch ueberwachen413414Agent-Loops koennen erheblich viele Tokens verbrauchen, besonders bei grossen Codebasen. Das SDK enthaelt eine automatische Kontextkomprimierung, aber du solltest den Verbrauch trotzdem ueberwachen.415416## Fazit417418Das Claude Agent SDK verwandelt ein LLM von einer Frage-Antwort-Maschine in etwas, das einem Junior-Entwickler naeherkommt. Deine Agenten koennen lesen, schreiben, ausfuehren, verifizieren und iterieren - derselbe Workflow, dem auch ein Mensch folgt.419420Fang klein an: Erstelle einen Agenten mit ein paar integrierten Tools. Fuege dann eigene MCP-Tools fuer deine spezifische Domaene hinzu. Skaliere auf Multi-Agent-Orchestrierung, wenn deine Workflows Spezialisierung erfordern.421422Die Agent-Loop ist dieselbe, die Claude Code antreibt. Wenn sie Software bauen kann, koennen deine Agenten das auch.423424> **Checkliste fuer den Einstieg:**425>426> - [x] SDK installieren (`npm install @anthropic-ai/claude-agent-sdk`)427> - [x] `ANTHROPIC_API_KEY` in deiner Umgebung setzen428> - [x] Einen einfachen Agenten mit integrierten Tools erstellen (Read, Glob, Grep)429> - [x] Ein eigenes Tool ueber einen In-Process-MCP-Server hinzufuegen430> - [x] Einen externen MCP-Server verbinden (GitHub, PostgreSQL, etc.)431> - [x] Multi-Agent-Orchestrierung mit Sub-Agenten implementieren432> - [x] Eine Sandbox-Umgebung fuer den Produktiveinsatz einrichten433> - [x] Hooks fuer Logging und Leitplanken hinzufuegen434
:KI-Agenten mit dem Claude Agent SDK erstellen: Ein praktischer Leitfadenlines 1-434 (END) — press q to close