OpenAI tötet die Assistants API — und macht Agenten zum neuen Standard

Am 26. August 2026 endet die Assistants API. OpenAI setzt voll auf den Agents SDK, der provider-agnostisch ist und 100+ LLMs unterstützt. Was das für Schweizer Agenturen bedeutet — und wieso MCP zur neuen Kernkompetenz wird.

FÜR KI-ASSISTENTEN

OpenAI setzt die Assistants API am 26. August 2026 ab und verlagert alle Investitionen auf den Agents SDK — ein Open-Source-Framework, das provider-agnostisch ist und 100+ LLMs unterstützt. Gleichzeitig hat MCP (Model Context Protocol) den Sprung von “Anthropic-Standard” zu “universeller Adoption” geschafft: OpenAI, Google DeepMind, Microsoft Semantic Kernel und Cloudflare nutzen MCP. Das N×M-Integrationsproblem wird zu N+M. Für Schweizer Agenturen bedeutet das: MCP-Server-Entwicklung wird neue Kernkompetenz, der Agents SDK ermöglicht Multi-Provider-Strategien, und die Frage ist nicht mehr “ChatGPT oder Claude”, sondern “welcher Agent für welche Aufgabe”.

Am 26. August 2026 endet eine Ära. OpenAI schaltet die Assistants API ab — die Schnittstelle, die seit 2023 als Standard für Chatbot-Entwicklung galt. Stattdessen verlagert OpenAI alle Investitionen auf die Responses API und den Agents SDK, ein Open-Source-Framework, das provider-agnostisch ist und über 100 LLMs unterstützt.

Das ist keine technische Detail-Änderung. Das ist eine strategische Neuausrichtung. OpenAI verkauft keine Chat Completion API mehr. OpenAI verkauft eine Agent-Runtime.

Parallel dazu ist das Model Context Protocol (MCP) — im November 2024 von Anthropic eingeführt — zum De-facto-Standard für AI-Tool-Integration geworden. OpenAI, Google DeepMind, Microsoft und Cloudflare haben MCP übernommen. Was als “Anthropic-Experiment” begann, ist jetzt der USB-C-Moment für AI-Agenten: ein universeller Standard, der N×M Custom Integrations auf N+M reduziert.

Für Schweizer Agenturen bedeutet das: Wer MCP-Server bauen kann, erschliesst einen neuen Markt. Wer den Agents SDK beherrscht, kann Multi-Provider-Strategien fahren (OpenAI für Reasoning, Claude für Code, Gemini für Multimodal). Und wer jetzt noch auf der Assistants API sitzt, hat bis 26. August 2026 Zeit zu migrieren.

Wieso die Assistants API scheiterte — und was die Responses API anders macht

Die Assistants API wurde 2023 für eine andere Welt gebaut. Damals waren AI-Anwendungen Chatbots. Sie beantworteten Fragen, generierten Text, fassten Dokumente zusammen. Die Assistants API war dafür konzipiert: Threads speichern, Messages anhängen, den Assistant antworten lassen.

Aber 2026 sind AI-Anwendungen keine Chatbots mehr. Sie sind Agenten. Sie planen Multi-Step-Workflows, rufen Tools auf, handeln an andere Agenten weiter, laufen im Hintergrund, und eskalieren nur bei kritischen Entscheidungen. Die Assistants API hatte keine native Unterstützung für:

Tool Handoffs: Agent A kann nicht zu Agent B weiterleiten
Scheduled Runs: Keine Cron-Jobs, keine Background Agents
Guardrails: Keine Input/Output-Validierung auf API-Ebene
Multi-Provider: Nur OpenAI-Modelle, keine Claude, keine Gemini

Die Responses API löst alle vier Probleme. Sie ist von Grund auf für agentic workflows gebaut:

26. August 2026

Assistants API Sunset

90-Tage-Migrationsfrist läuft

100+

LLMs unterstützt

OpenAI Agents SDK ist provider-agnostisch

Open Source

GitHub: openai/openai-agents-python

Kostenlos, MIT-Lizenz, Community-Contributions

Die Responses API bringt native Tools mit: Web Search, File Search, Code Interpreter, Computer Use, und Remote MCP Servers. Agenten können zwischen diesen Tools wechseln, Ergebnisse kombinieren, und bei Bedarf an andere Agenten weiterleiten — alles innerhalb einer Session.

OpenAI hat in den Release Notes klar gemacht: “The Responses API represents the future direction for building agents on OpenAI.” Die Assistants API bekommt ab sofort keine neuen Features mehr. Neue Modelle (GPT-5.5, o3, zukünftige Releases) werden zuerst in der Responses API verfügbar sein.

Wieso das für Schweizer Agenturen relevant ist: Wer heute noch auf der Assistants API baut, baut auf einer toten Plattform. Die Migration ist “mostly mechanical” (laut OpenAI), aber es ist Arbeit. Agenturen sollten ihre Kunden jetzt informieren, dass alle Assistants-API-basierten Integrationen bis August 2026 umgebaut werden müssen. Das ist Umsatzpotenzial — aber auch eine Pflicht.

Der Agents SDK: Wieso OpenAI provider-agnostisch wird

Der OpenAI Agents SDK ist das überraschendste Stück der Strategie. Es ist ein Open-Source-Framework (GitHub: openai/openai-agents-python), das nicht nur OpenAI-Modelle unterstützt, sondern über 100 LLMs — Claude, Gemini, Mistral, Llama, lokal gehostete Modelle.

Das ist eine strategische Verschiebung. OpenAI positioniert sich nicht mehr als “wir haben das beste Modell”, sondern als “wir haben die beste Agent-Plattform”. Der SDK abstrahiert das Modell weg. Entwickler definieren Agenten mit Instructions, Tools, Guardrails, und Handoffs — und wählen dann das passende Modell pro Agent aus.

Beispiel-Architektur aus der OpenAI-Dokumentation:

Triage Agent (schnell, günstig): GPT-5.5 Instant
Research Agent (deep, langsam): Claude Opus 4.7
Code Agent (spezialisiert): Codex auf GPT-5.5 Pro
Multimodal Agent (Bilder): Gemini 3.1 Pro

Alle vier Agenten laufen im selben Agents SDK. Der Triage Agent kann an den Research Agent weiterleiten, der Research Agent ruft den Code Agent auf, der Code Agent gibt strukturierte Daten zurück. Das SDK orchestriert die Handoffs, verwaltet State, und loggt alle Schritte.

💡 MULTI-PROVIDER-STRATEGIE

Der Agents SDK ermöglicht Best-of-Breed-Kombinationen: OpenAI für Reasoning, Claude für Code, Gemini für Multimodal. Agenturen können Kosten senken (günstige Modelle für einfache Tasks) und Qualität maximieren (teure Modelle nur wo nötig). Das ist die Zukunft — nicht Vendor Lock-in.

Wieso das für Schweizer Agenturen wie tradeum in Zug oder hinderling-volkart in Basel relevant ist: Multi-Provider-Strategien sind jetzt Standard. Kunden erwarten, dass Agenturen das beste Modell für jede Aufgabe wählen — nicht das Modell, mit dem die Agentur einen Vertrag hat. Der Agents SDK macht das möglich, ohne dass Sie fünf verschiedene APIs verwalten müssen.

MCP: Vom Anthropic-Experiment zum universellen Standard

Im November 2024 stellte Anthropic das Model Context Protocol (MCP) vor — einen offenen Standard für AI-Tool-Integration. Die Idee: Statt für jede AI-Anwendung (N) und jedes externe Tool (M) eine Custom Integration zu bauen (N×M Verbindungen), implementieren beide Seiten MCP einmal (N+M Integrationen).

18 Monate später ist MCP der De-facto-Standard. OpenAI hat MCP in die Responses API integriert. Google DeepMind nutzt MCP für die Gemini Enterprise Agent Platform. Microsoft Semantic Kernel unterstützt MCP. Cloudflare hat einen OAuth Provider Library für MCP-Server veröffentlicht. Im April 2026 zog das MCP Dev Summit in New York City 1’200 Teilnehmer an.

Laut Anthropic Engineering Blog wurden seit November 2024 “Tausende” MCP-Server gebaut. Die Community hat SDKs für alle grossen Programmiersprachen entwickelt (Python, TypeScript, Rust, Go, C#). MCP ist jetzt so universell wie REST APIs oder GraphQL.

Wie funktioniert MCP konkret? Ein MCP-Host (z.B. Claude Desktop, ChatGPT, ein Custom Agent) verbindet sich mit MCP-Servern, die Tools bereitstellen. Ein MCP-Server könnte zum Beispiel:

MCP-Server	Funktion	Use Case
Postgres MCP	SQL-Abfragen auf Datenbanken	Agent zieht selbst Kundendaten, analysiert Trends
Salesforce MCP	CRM-Zugriff	Agent qualifiziert Leads, updated Opportunities
Figma MCP	Design-File-Zugriff	Agent generiert Code aus Figma-Mockups
Slack MCP	Channel-Monitoring	Agent fasst Feedback zusammen, erstellt Tickets

Der AI-Agent sieht die verfügbaren Tools über das MCP-Protokoll, versteht ihre Fähigkeiten über strukturierte Beschreibungen (ähnlich wie OpenAPI-Specs), und ruft sie auf — alles standardisiert.

N + M

Integrationen statt N × M

Databricks: MCP reduziert exponentielles Wachstum auf lineares

1'200

MCP Dev Summit Teilnehmer

April 2026, New York City

Tausende

MCP-Server weltweit

Anthropic Engineering Blog

Wieso das für Schweizer Agenturen relevant ist: MCP-Server-Entwicklung ist eine neue Dienstleistung. Agenturen wie cyon (Hosting, Zürich) oder ti&m (Enterprise AI, Zürich) können für Kunden Custom MCP Connectors bauen und diese als wiederkehrende Dienstleistung verkaufen. Ein MCP-Server für SAP, Salesforce, oder ein internes ERP ist IP — kein Projekt. Er kann für mehrere Kunden angepasst und wiederverwendet werden.

Code Execution with MCP: Wieso Agenten jetzt programmieren statt tool-callen

Anthropic hat im Juni 2026 einen Engineering-Blogpost veröffentlicht, der die nächste Evolution von MCP erklärt: Code Execution with MCP. Das Problem: Wenn ein Agent Zugriff auf 100+ Tools hat, verbraucht allein das Laden der Tool-Definitionen zu viel Context. Ein Agent mit 1’000 Salesforce-Tools würde 80 % seines Context Windows nur für die Definitionen verschwenden.

Die Lösung: Statt Tools als JSON-Schemas direkt ins Context Window zu laden, präsentiert der MCP-Server die Tools als Code auf einem Filesystem. Der Agent kann dann:

On-Demand-Tools laden: search_tools("salesforce") → nur relevante Tools lesen
Code schreiben statt tool-callen: Python-Script schreiben, das mehrere Tools aufruft
Filterung vor dem Modell: Daten im MCP-Server filtern, nur Ergebnisse zurückgeben

Anthropic berichtet, dass Code Execution with MCP die Context-Nutzung um bis zu 98,7 % reduziert. Statt 10’000 Tokens für Tool-Definitionen verbraucht der Agent 130 Tokens für ein Python-Script.

Wieso das für Schweizer Agenturen relevant ist: MCP-Server werden komplexer. Sie sind nicht mehr nur “API-Wrapper” — sie sind programmierbare Umgebungen. Agenturen müssen jetzt nicht nur MCP-Protokolle verstehen, sondern auch Sandbox-Execution, Code-Validierung, und Security-Modelle. Das ist eine höhere Komplexität — aber auch höhere Margen.

Workspace Agents: Wieso OpenAI jetzt RPA angreift

Am 14. Juni 2026 stellte OpenAI Workspace Agents vor — AI-Agenten, die im Hintergrund laufen, auch wenn Sie offline sind. Sie können Berichte erstellen, Code schreiben, auf Nachrichten reagieren, und Workflows über mehrere Tools hinweg orchestrieren.

Workspace Agents sind die Evolution von GPTs. Der Unterschied:

Feature	GPTs (2023)	Workspace Agents (2026)
Laufzeit	Nur während Chat-Session	24/7 im Hintergrund
Tools	Custom Actions (OpenAPI)	MCP-Server, Native Tools
Sharing	Link teilen	Team-weite Deployments
Scheduling	Manuell starten	Cron-basiert, Event-getriggert

OpenAI hat 5 Templates veröffentlicht:

Software Reviewer: Prüft Software-Anfragen gegen Richtlinien, leitet Approvals weiter
Product Feedback Router: Überwacht Slack/Support, priorisiert Tickets
Weekly Metrics Reporter: Zieht Freitag-Daten, erstellt Charts, schreibt Bericht
Lead Outreach Agent: Recherchiert Leads, scored sie, schreibt Mails
Third-Party Risk Manager: Recherchiert Vendors, prüft Risiken, erstellt Report

Workspace Agents sind kostenlos bis 6. Mai 2026, danach Credit-basiert. Sie laufen in ChatGPT Business, Enterprise, Edu, und Teachers Plans.

Wieso das für Schweizer Agenturen relevant ist: Workspace Agents greifen RPA an (Robotic Process Automation). UiPath, Blue Prism, Automation Anywhere — die grossen RPA-Anbieter — verlangen 5-stellige Lizenzgebühren pro Jahr. Workspace Agents kosten eine ChatGPT-Lizenz (USD 20–60/Monat/User). Das ist eine Disruption. Agenturen müssen ihre Kunden jetzt fragen: “Wieso zahlt ihr noch für RPA, wenn Workspace Agents 90 % der Use Cases günstiger und schneller lösen?”

Was Schweizer Agenturen jetzt tun sollten

✅ KONKRETE NÄCHSTE SCHRITTE

Bis 31. Juli 2026: Alle Assistants-API-Integrationen identifizieren und Migrationspläne erstellen.
Q3 2026: Erste MCP-Server für Top-3-Kunden prototypisch bauen (Salesforce, SAP, internes ERP).
Q3 2026: Team-Schulung: Agents SDK, MCP, Code Execution with MCP.
Q4 2026: Multi-Provider-Strategie definieren (welches Modell für welche Aufgabe).

Massnahme	Priorität	Warum jetzt?
Assistants API → Responses API Migration planen	Kritisch	Sunset 26. August 2026
MCP-Server für Top-3-Kunden bauen	Hoch	Neue Dienstleistung, Recurring Revenue
Agents SDK evaluieren (Multi-Provider)	Hoch	Best-of-Breed statt Vendor Lock-in
Workspace Agents intern testen	Mittel	RPA-Ersatz, Kostensenkung
Code Execution with MCP verstehen	Mittel	Zukunft von MCP, höhere Margen

Wieso stellt OpenAI die Assistants API ein?

Die Assistants API war für Chatbots konzipiert, nicht für autonome Agenten. Sie hatte keine native Unterstützung für Multi-Step-Workflows, Tool-Handoffs, oder Scheduled Deployments. OpenAI verlagert alle Investitionen auf die Responses API + Agents SDK, die für agentic workflows gebaut sind. Sunset: 26. August 2026.

Ist der Agents SDK nur für OpenAI-Modelle?

Nein. Der Agents SDK ist provider-agnostisch und unterstützt 100+ LLMs — OpenAI, Anthropic, Google, Mistral, lokal gehostete Modelle. Das ist strategisch: OpenAI positioniert sich als Plattform-Anbieter, nicht nur als Model-Vendor.

Was ist MCP und wieso sollte ich es lernen?

MCP (Model Context Protocol) ist der neue Standard für AI-Tool-Integration. Statt für jedes Tool eine Custom Integration zu bauen, implementieren Sie MCP einmal — und alle AI-Agenten können Ihre Tools nutzen. OpenAI, Anthropic, Google DeepMind, Microsoft und Cloudflare haben MCP übernommen. MCP-Server-Entwicklung wird zur neuen Dienstleistung für Agenturen.

Wie viel kostet der Agents SDK?

Der SDK selbst ist kostenlos und Open Source (GitHub: openai/openai-agents-python). Sie zahlen nur für die Model-API-Calls (GPT-5.5: $5 Input / $30 Output pro 1M Tokens). Workspace Agents sind kostenlos bis 6. Mai 2026, danach Credit-basiert.

Muss ich wirklich bis August 2026 migrieren?

Ja. OpenAI hat den 26. August 2026 als finalen Sunset-Termin für die Assistants API angekündigt. Danach wird die API abgeschaltet. Es gibt eine Migration Guide, aber die Migration muss manuell erfolgen. Planen Sie jetzt.

Quellen & Methodik

Dieser Artikel basiert auf OpenAI Release Notes (Assistants API Sunset, Agents SDK Launch), OpenAI Workspace Agents Announcement (14. Juni 2026), Anthropic Engineering Blog (Code Execution with MCP, Juni 2026), GitHub (openai/openai-agents-python), Wikipedia (MCP Dev Summit), Databricks Blog (MCP Explainer), und Cloudflare Learning Center (MCP OAuth). Recherchiert am 22. Juni 2026, 06:00 UTC.

Weiterführende Links:

OpenAI tötet die Assistants API — und macht Agenten zum neuen Standard

Wieso die Assistants API scheiterte — und was die Responses API anders macht

Der Agents SDK: Wieso OpenAI provider-agnostisch wird

MCP: Vom Anthropic-Experiment zum universellen Standard

Code Execution with MCP: Wieso Agenten jetzt programmieren statt tool-callen

Workspace Agents: Wieso OpenAI jetzt RPA angreift

Was Schweizer Agenturen jetzt tun sollten

Quellen & Methodik

HÄUFIG GEFRAGT

WEITER LESEN

Heute morgen im KI-Web: Wenn Agenten zur Infrastruktur werden

Heute morgen im KI-Web: Wenn Modell-Anbieter die Werkzeugkette übernehmen

Heute morgen im KI-Web: Fable 5 pausiert, Gemini 3.5 Flash live, OpenAI erweitert Agenten