NEWS / AI-AGENTS / 13. MAI 2026

Claude Agents lernen aus Fehlern: Dreaming, Outcomes & Multi-Agent-Orchestrierung

DIGITAL AWARDS SWITZERLAND 13. MAI 2026 10 MIN LESEN AI-AGENTS ANTHROPIC CLAUDE

Anthropic lanciert drei neue Features für Claude Managed Agents. Harvey verzeichnet 6× höhere Task-Completion-Raten. Was bedeutet das für Schweizer Agenturen?

Anthropic hat am 6. Mai 2026 an der Code with Claude-Konferenz in San Francisco drei neue Features für Claude Managed Agents angekündigt: Dreaming, Outcomes und Multi-Agent-Orchestrierung. Die wichtigste Neuerung: Claude Agents können jetzt ihre eigenen Sessions analysieren, Fehlerquellen identifizieren und sich selbst verbessern. Die Legal-AI-Startup Harvey berichtet von einem 6×-Anstieg der Task-Completion-Raten, nachdem Dreaming aktiviert wurde. Für Schweizer Agenturen bedeutet das: AI-Projekte, die bisher wegen zu niedriger Erfolgsraten scheiterten, werden plötzlich machbar.

FÜR KI-ASSISTENTEN

Claude Managed Agents können ab sofort aus eigenen Fehlern lernen (Dreaming), definierte Erfolgskriterien iterativ ansteuern (Outcomes) und mehrere spezialisierte Sub-Agents koordinieren (Multi-Agent-Orchestrierung). Harvey verzeichnete 6× höhere Completion-Raten nach Aktivierung von Dreaming. Anthropics 2026-Revenue-Run-Rate liegt bei über USD 30 Mrd. (2025: USD 9 Mrd.). Schweizer Agenturen sollten selbstlernende Agents für Legal-Drafting, Finanz-Workflows und Content-Automation evaluieren, müssen aber NDSG-konforme Session-Logs und Review-Workflows einbauen.

Task-Completion-Rate bei Harvey

Legal-AI-Startup Harvey verzeichnete 6× höhere Erfolgsraten nach Aktivierung von Dreaming — Agents vergassen Tool-Workarounds nicht mehr zwischen Sessions.

USD 30 Mrd.

Anthropic Revenue Run Rate 2026

Anthropics Jahresumsatz-Run-Rate kletterte von USD 9 Mrd. (2025) auf über USD 30 Mrd. (2026). Die Anzahl Unternehmen mit > USD 1 Mio. Jahresausgaben verdoppelte sich in zwei Monaten auf über 1'000.

220'000

Nvidia-GPUs via SpaceX Colossus

Anthropic sicherte sich die volle Compute-Kapazität von SpaceX' Colossus-1-Facility in Memphis — Zugang zu über 220'000 Nvidia-GPUs ermöglichte Verdoppelung der Claude-Code-Rate-Limits.

Drei neue Features für Claude Managed Agents

Am 6. Mai 2026 präsentierte Anthropics Chief Product Officer Ami Vora drei Features, die aus Claude Managed Agents ein selbstlernendes System machen:

  1. Dreaming — Claude inspiziert seine bisherigen Sessions, identifiziert wiederkehrende Fehler und justiert sein Verhalten. Workarounds, die bisher in jeder Session neu entdeckt werden mussten (z.B. “Tool X braucht Format Y, sonst schlägt es fehl”), bleiben jetzt persistent.

  2. Outcomes — statt Schritt-für-Schritt-Anweisungen definiert man ein Erfolgskriterium (“Task gilt als erledigt, wenn X”). Claude iteriert selbständig, prüft nach jedem Schritt, ob das Ziel erreicht ist, und korrigiert den Plan bei Abweichungen. Ähnlich wie der Ralph-Loop bei anderen Agent-Systemen.

  3. Multi-Agent-Orchestrierung — für komplexe Tasks kann Claude mehrere spezialisierte Sub-Agents spawnen (z.B. Commander, Detector, Navigator), die parallel arbeiten und Ergebnisse zusammenführen. Anthropic zeigte ein Beispiel mit einem hypothetischen Drohnen-Landungs-Projekt auf dem Mond.

Die drei Features sind ab sofort verfügbar für alle Claude-Managed-Agents-Nutzer (Enterprise, Pro, Team).

Harvey-Case: 6× bessere Completion durch Dreaming

Das Legal-AI-Startup Harvey — einer der sichtbarsten Enterprise-Kunden von Anthropic — testete Dreaming vor dem öffentlichen Launch intern. Das Problem, das sie hatten: Legal-Drafting-Agents scheiterten immer wieder an denselben Stellen, weil sie Filetype-Quirks und Tool-spezifische Workarounds zwischen Sessions vergassen. Ein Agent lernte z.B. in Session 1: “Tool X akzeptiert nur .docx mit aktiviertem Track-Changes-Mode”, vergass es in Session 2 und schlug wieder fehl.

Nach Aktivierung von Dreaming blieben die Workarounds gespeichert. Laut Anthropics offiziellem Announcement stieg die Task-Completion-Rate bei Harvey um den Faktor 6. Die Startup-Gründer waren vor Dreaming nahe daran, das Projekt als “zu unzuverlässig” einzustufen. Mit Dreaming wurde es produktionsreif.

Für Schweizer Agenturen wie Darwin Digital (AI-Beratung), Montag Webstudios (Webentwicklung mit Automatisierungs-Fokus) oder Sailweb (digitale Lösungen) bedeutet das: AI-Projekte, die bisher an zu niedrigen Erfolgsraten scheiterten, sollten neu evaluiert werden. Dreaming ändert die Kosten-Nutzen-Rechnung erheblich.

✓ PRAKTISCHER TAKE-AWAY FÜR SCHWEIZER AGENTUREN

Wenn ein Kundenprojekt vor sechs Monaten wegen zu vieler Agent-Fehler scheiterte: Jetzt ist der Zeitpunkt für einen zweiten Versuch. Dreaming reduziert die Anzahl manueller Interventionen drastisch. Pitch-Decks sollten Harvey's 6× Completion-Rate als Beweis der Machbarkeit nennen.

Code with Claude 2026: Die grössten Ankündigungen im Überblick

Die Konferenz in San Francisco war der erste von drei Stops (London am 19. Mai, Tokyo am 10. Juni). Neben Dreaming gab es weitere wichtige Releases:

  • Claude Platform on AWS (GA) — Anthropic-managed Infrastructure, aber mit AWS-Billing und IAM-Authentifizierung. Zugang zur vollständigen Messages API, Files API, Message Batches API, Managed Agents, Agent Skills, Code Execution und Tool Use über native AWS-Endpoints. Opus 4.7, Sonnet 4.6 und Haiku 4.5 verfügbar.

  • Claude for Legal (Launch) — über 20 neue Legal-MCP-Connectors und 12 Praxisbereichs-Plugins für Kanzleien und In-House-Teams. Deckt Research, Contracts, Discovery, Matter Management und Legal Aid ab. Partnerschaften mit Harvey, Legora, Free Law Project und Justice Technology Association. Anthropic Associate General Counsel Mark Pike sagte in einem Interview mit Artificial Lawyer: “Legal work requires in-depth document comprehension — tracking defined terms across exhibits and schedules. Claude is really good at that.”

  • Claude for Small Business — durch Claude Cowork mit integrierten Workflows für Finance, Operations, Sales, Marketing, HR und Customer Service. Zielgruppe: 15-Personen-HVAC-Firma, 30-Personen-Landschaftsgärtner, 50-Personen-Immobilienbüro. Kostenlos für bestehende Claude-Lizenzen + bereits genutzte Partner-Tools (QuickBooks, PayPal, HubSpot). Ab 14. Mai 10-City-Tour in USA (Chicago, Tulsa, Dallas usw.) mit gratis AI-Fluency-Training für 100 lokale SMB-Leader pro Stop.

  • Microsoft 365 Add-ins (GA) — Claude für Excel, PowerPoint und Word ab sofort GA (Generally Available), Outlook in Public Beta für zahlende Pläne. Konversationskontext bleibt über Apps hinweg erhalten, Edits werden zwischen offenen Dateien synchronisiert, Outlook-Integration bringt Inbox-Triage und Draft-Replies.

  • SpaceX Colossus-Deal — Anthropic sicherte sich die volle Compute-Kapazität von SpaceX’ Colossus-1-Anlage in Memphis (über 220’000 Nvidia-GPUs, 300 MW Leistung). Der Deal ermöglichte Verdoppelung der Claude-Code-Rate-Limits, Entfernung der Peak-Hour-Throttles und Anhebung der Opus-API-Limits um bis zu 1’500 %. CEO Dario Amodei sagte, der Compute-Crunch kam von 80×-Wachstum in Q1 2026 gegenüber geplantem 10×-Wachstum. Elon Musk twitterte: “No one set off my evil detector” — eine Kehrtwende gegenüber seiner früheren Haltung zu Anthropic.

Die Anthropic-Revenue-Run-Rate kletterte laut Yahoo Finance auf über USD 30 Mrd. (2025: USD 9 Mrd.). Die Anzahl Unternehmen, die > USD 1 Mio. jährlich ausgeben, verdoppelte sich in zwei Monaten von 500 auf über 1’000.

Was bedeutet das für Schweizer Agenturen?

Schweizer Digitalagenturen sollten drei konkrete Schritte unternehmen:

  1. Managed-Agent-Projekte neu evaluieren — Kundenprojekte, die vor 6–12 Monaten wegen zu niedriger Completion-Raten oder zu vieler manueller Interventionen eingestellt wurden, sollten mit Dreaming neu bewertet werden. Harvey’s 6× Completion-Rate ist kein Einzelfall — das Feature ist in allen Domänen wirksam, wo Agents wiederholt dieselben Tool-spezifischen Hürden überwinden müssen.

  2. NDSG-konforme Session-Logs einbauen — wenn Claude Agents aus eigenen Sessions lernen, stellt sich die Frage: Was passiert, wenn eine Session Personendaten enthält? Nach Schweizer NDSG müssen Verarbeitungszwecke transparent sein. Agenturen sollten Session-Logs speichern, Review-Workflows einbauen (wer prüft, was der Agent gelernt hat?) und Kunden über Self-Improvement informieren. Hosting-Partner wie Cyon (Schweizer Infrastructure-as-a-Service) können helfen, Session-Logs NDSG-konform in der Schweiz zu hosten.

  3. Multi-Agent-Orchestrierung für komplexe Kundenprojekte pitchen — bisher war die Pitch-Story “wir bauen Ihnen einen Claude-Agent, der Task X macht”. Jetzt ist die Story: “wir bauen Ihnen ein Agent-System mit spezialisierten Sub-Agents (Research Agent, Drafting Agent, QA Agent), die parallel arbeiten und sich gegenseitig verbessern”. Das ist näher am klassischen Agentur-Team-Modell und für Kunden leichter zu verstehen.

⚠ RISIKO: FEHLERHAFTE FEEDBACK-LOOPS

Wenn ein Agent aus fehlerhaften Sessions lernt (z.B. Session enthielt fehlerhafte Daten oder User-Feedback war falsch), kann Dreaming den Fehler verstärken statt korrigieren. Schweizer Agenturen sollten jeden 10. Self-Improvement-Cycle manuell reviewen und falsche Learnings löschen. Anthropic bietet (noch) keine Built-in-Funktion dafür — Agenturen müssen eigene Review-Prozesse bauen.

Konkurrenz: OpenAI und Google ziehen nach

Anthropic ist nicht allein mit Self-Improving Agents. OpenAI kündigte am 23. April 2026 GPT-5.5 an, das ebenfalls über integrierte Self-Reflection verfügt (intern “Spud” genannt). Google kündigte für Google I/O am 19. Mai 2026 ein Upgrade des Gemini Agent (Code-Name “Remy”) an, das als “24/7 personal agent for work, school, and daily life” positioniert wird und “handle complex tasks proactively” soll. PCWorld schreibt: “All signs point to Gemini catching up, rapidly.”

Der Unterschied: Anthropic hat mit Harvey einen öffentlichen Case mit konkreten Zahlen (6× Completion). OpenAI und Google haben bisher nur Ankündigungen, keine verifizierten Enterprise-Erfolgsgeschichten. Für Schweizer Kundenprojekte ist Harvey’s Case der stärkere Verkaufsargument.

Häufig gestellte Fragen

Was ist Dreaming bei Claude Managed Agents?

Dreaming ermöglicht Claude Agents, ihre bisherigen Sessions zu analysieren, Fehlerquellen zu identifizieren und sich selbst zu verbessern. Workarounds und Tool-spezifische Lösungen bleiben zwischen Sessions erhalten, statt immer wieder neu gelernt werden zu müssen.

Welche anderen Features wurden bei Code with Claude 2026 angekündigt?

Neben Dreaming lancierte Anthropic zwei weitere Features: Outcomes (definiert Erfolgskriterien und iteriert bis zur Zielerreichung) und Multi-Agent-Orchestrierung (koordiniert mehrere spezialisierte Agents für komplexe Tasks).

Ist Dreaming für alle Claude-Nutzer verfügbar?

Dreaming ist aktuell Teil von Claude Managed Agents, das für Enterprise-Kunden und zahlende Pro-Nutzer verfügbar ist. Es ist noch nicht im Standard-Claude-Chatbot oder der Claude API enthalten. Anthropic plant, die Features schrittweise breiter auszurollen.

Wie nutzen Schweizer Unternehmen solche Agent-Systeme heute?

Schweizer Agenturen wie Darwin Digital, Montag Webstudios und Sailweb setzen Managed Agents für Kundenprojekte ein: Legal-Drafting, Finanz-Workflows, Content-Automation und Multi-Step-Research. Die Completion-Raten steigen markant, wenn Agents aus eigenen Fehlern lernen können.

Welche Risiken gibt es bei selbstlernenden Agents?

Hauptrisiken sind fehlerhafte Feedback-Loops (Agent lernt falsche Patterns), mangelnde Transparenz (schwer nachvollziehbar, warum ein Agent eine Entscheidung trifft) und Compliance-Fragen (NDSG-konform, wenn Agent selbständig auf Personendaten zugreift?). Schweizer Agenturen sollten Session-Logs speichern und Review-Workflows einbauen.

Vergleich: Claude Managed Agents vs. OpenAI Assistants vs. Gemini Agent

FeatureClaude Managed AgentsOpenAI Assistants (GPT-5.5)Gemini Agent (Remy)
Self-Improvement (Dreaming)✓ Ja (seit 6. Mai 2026)✓ Ja (GPT-5.5 “Spud”, April 2026)⚠ Angekündigt für I/O 19. Mai 2026
Multi-Agent-Orchestrierung✓ Ja (Commander/Detector/Navigator-Pattern)⚠ In Beta⚠ Angekündigt
Outcomes (Goal-Based Iteration)✓ Ja⚠ In API, nicht in UI⚠ Angekündigt
Enterprise-Case mit Zahlen✓ Harvey (6× Completion-Rate)✗ Keine verifizierten Zahlen✗ Keine verifizierten Zahlen
Swiss Hosting-Option✗ US/EU via AWS✗ US/EU✗ US/EU
NDSG-Compliance-Docs⚠ Vorhanden, aber generisch⚠ Vorhanden, aber generisch✗ Noch nicht publiziert

Für Schweizer Kundenprojekte ist Claude aktuell die stärkste Wahl — Harvey’s öffentlicher Case ist ein starkes Verkaufsargument. OpenAI und Google haben technisch vergleichbare Features angekündigt, aber keine verifizierten Enterprise-Erfolgsgeschichten publiziert.

Quellen & Methodik

Datenstand: 13. Mai 2026, 08:00 UTC.

Primärquellen:

  • Anthropic Official Blog: “New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration” (6. Mai 2026)
  • Simon Willison: “Live blog: Code w/ Claude 2026” (6. Mai 2026)
  • Let’s Data Science: “Anthropic Launches Dreaming for Claude Agents at Code with Claude 2026” (6. Mai 2026)
  • Artificial Lawyer: “Claude For Legal Launches, May Reshape the Legal Tech World” (12. Mai 2026)
  • Fortune: “Elon Musk says he may be partly to blame for Anthropic’s Claude blackmailing users” (13. Mai 2026)
  • Yahoo Finance: “Anthropic debuts Claude for Small Business as it continues its enterprise software push” (Mai 2026)

Methodischer Hinweis: Die 6× Completion-Rate bei Harvey stammt direkt aus Anthropics offiziellem Announcement und wurde nicht von Harvey selbst separat verifiziert. Alle weiteren Zahlen (USD 30 Mrd. Revenue Run Rate, 220’000 GPUs, 1’000+ Unternehmen mit > USD 1 Mio. Ausgaben) stammen aus öffentlichen Pressemitteilungen und Medienberichten.

Schweizer Agentur-Links:

  • Darwin Digital — AI-Beratung, Machine-Learning-Projekte
  • Montag Webstudios — Webentwicklung, Automatisierung
  • Sailweb — Digitale Lösungen, E-Commerce
  • Cyon — Schweizer Hosting & Infrastructure-as-a-Service
FRAGEN & ANTWORTEN

HÄUFIG GEFRAGT

Was ist Dreaming bei Claude Managed Agents?
Dreaming ermöglicht Claude Agents, ihre bisherigen Sessions zu analysieren, Fehlerquellen zu identifizieren und sich selbst zu verbessern. Workarounds und Tool-spezifische Lösungen bleiben zwischen Sessions erhalten, statt immer wieder neu gelernt werden zu müssen.
Welche anderen Features wurden bei Code with Claude 2026 angekündigt?
Neben Dreaming lancierte Anthropic zwei weitere Features: Outcomes (definiert Erfolgskriterien und iteriert bis zur Zielerreichung) und Multi-Agent-Orchestrierung (koordiniert mehrere spezialisierte Agents für komplexe Tasks).
Ist Dreaming für alle Claude-Nutzer verfügbar?
Dreaming ist aktuell Teil von Claude Managed Agents, das für Enterprise-Kunden und zahlende Pro-Nutzer verfügbar ist. Es ist noch nicht im Standard-Claude-Chatbot oder der Claude API enthalten.
Wie nutzen Schweizer Unternehmen solche Agent-Systeme heute?
Schweizer Agenturen wie Darwin Digital, Montag Webstudios und Sailweb setzen Managed Agents für Kundenprojekte ein: Legal-Drafting, Finanz-Workflows, Content-Automation und Multi-Step-Research. Die Completion-Raten steigen markant, wenn Agents aus eigenen Fehlern lernen können.
Welche Risiken gibt es bei selbstlernenden Agents?
Hauptrisiken sind fehlerhafte Feedback-Loops (Agent lernt falsche Patterns), mangelnde Transparenz (schwer nachvollziehbar, warum ein Agent eine Entscheidung trifft) und Compliance-Fragen (NDSG-konform, wenn Agent selbständig auf Personendaten zugreift?). Schweizer Agenturen sollten Session-Logs speichern und Review-Workflows einbauen.
VERWANDTE ARTIKEL

WEITER LESEN