Am 26. August 2026 endet die Assistants API. OpenAI setzt voll auf den Agents SDK, der provider-agnostisch ist und 100+ LLMs unterstützt. Was das für Schweizer Agenturen bedeutet — und wieso MCP zur neuen Kernkompetenz wird.
OpenAI setzt die Assistants API am 26. August 2026 ab und verlagert alle Investitionen auf den Agents SDK — ein Open-Source-Framework, das provider-agnostisch ist und 100+ LLMs unterstützt. Gleichzeitig hat MCP (Model Context Protocol) den Sprung von “Anthropic-Standard” zu “universeller Adoption” geschafft: OpenAI, Google DeepMind, Microsoft Semantic Kernel und Cloudflare nutzen MCP. Das N×M-Integrationsproblem wird zu N+M. Für Schweizer Agenturen bedeutet das: MCP-Server-Entwicklung wird neue Kernkompetenz, der Agents SDK ermöglicht Multi-Provider-Strategien, und die Frage ist nicht mehr “ChatGPT oder Claude”, sondern “welcher Agent für welche Aufgabe”.
Am 26. August 2026 endet eine Ära. OpenAI schaltet die Assistants API ab — die Schnittstelle, die seit 2023 als Standard für Chatbot-Entwicklung galt. Stattdessen verlagert OpenAI alle Investitionen auf die Responses API und den Agents SDK, ein Open-Source-Framework, das provider-agnostisch ist und über 100 LLMs unterstützt.
Das ist keine technische Detail-Änderung. Das ist eine strategische Neuausrichtung. OpenAI verkauft keine Chat Completion API mehr. OpenAI verkauft eine Agent-Runtime.
Parallel dazu ist das Model Context Protocol (MCP) — im November 2024 von Anthropic eingeführt — zum De-facto-Standard für AI-Tool-Integration geworden. OpenAI, Google DeepMind, Microsoft und Cloudflare haben MCP übernommen. Was als “Anthropic-Experiment” begann, ist jetzt der USB-C-Moment für AI-Agenten: ein universeller Standard, der N×M Custom Integrations auf N+M reduziert.
Für Schweizer Agenturen bedeutet das: Wer MCP-Server bauen kann, erschliesst einen neuen Markt. Wer den Agents SDK beherrscht, kann Multi-Provider-Strategien fahren (OpenAI für Reasoning, Claude für Code, Gemini für Multimodal). Und wer jetzt noch auf der Assistants API sitzt, hat bis 26. August 2026 Zeit zu migrieren.
Wieso die Assistants API scheiterte — und was die Responses API anders macht
Die Assistants API wurde 2023 für eine andere Welt gebaut. Damals waren AI-Anwendungen Chatbots. Sie beantworteten Fragen, generierten Text, fassten Dokumente zusammen. Die Assistants API war dafür konzipiert: Threads speichern, Messages anhängen, den Assistant antworten lassen.
Aber 2026 sind AI-Anwendungen keine Chatbots mehr. Sie sind Agenten. Sie planen Multi-Step-Workflows, rufen Tools auf, handeln an andere Agenten weiter, laufen im Hintergrund, und eskalieren nur bei kritischen Entscheidungen. Die Assistants API hatte keine native Unterstützung für:
- Tool Handoffs: Agent A kann nicht zu Agent B weiterleiten
- Scheduled Runs: Keine Cron-Jobs, keine Background Agents
- Guardrails: Keine Input/Output-Validierung auf API-Ebene
- Multi-Provider: Nur OpenAI-Modelle, keine Claude, keine Gemini
Die Responses API löst alle vier Probleme. Sie ist von Grund auf für agentic workflows gebaut:
26. August 2026
Assistants API Sunset
90-Tage-Migrationsfrist läuft
100+
LLMs unterstützt
OpenAI Agents SDK ist provider-agnostisch
Open Source
GitHub: openai/openai-agents-python
Kostenlos, MIT-Lizenz, Community-Contributions
Die Responses API bringt native Tools mit: Web Search, File Search, Code Interpreter, Computer Use, und Remote MCP Servers. Agenten können zwischen diesen Tools wechseln, Ergebnisse kombinieren, und bei Bedarf an andere Agenten weiterleiten — alles innerhalb einer Session.
OpenAI hat in den Release Notes klar gemacht: “The Responses API represents the future direction for building agents on OpenAI.” Die Assistants API bekommt ab sofort keine neuen Features mehr. Neue Modelle (GPT-5.5, o3, zukünftige Releases) werden zuerst in der Responses API verfügbar sein.
Wieso das für Schweizer Agenturen relevant ist: Wer heute noch auf der Assistants API baut, baut auf einer toten Plattform. Die Migration ist “mostly mechanical” (laut OpenAI), aber es ist Arbeit. Agenturen sollten ihre Kunden jetzt informieren, dass alle Assistants-API-basierten Integrationen bis August 2026 umgebaut werden müssen. Das ist Umsatzpotenzial — aber auch eine Pflicht.
Der Agents SDK: Wieso OpenAI provider-agnostisch wird
Der OpenAI Agents SDK ist das überraschendste Stück der Strategie. Es ist ein Open-Source-Framework (GitHub: openai/openai-agents-python), das nicht nur OpenAI-Modelle unterstützt, sondern über 100 LLMs — Claude, Gemini, Mistral, Llama, lokal gehostete Modelle.
Das ist eine strategische Verschiebung. OpenAI positioniert sich nicht mehr als “wir haben das beste Modell”, sondern als “wir haben die beste Agent-Plattform”. Der SDK abstrahiert das Modell weg. Entwickler definieren Agenten mit Instructions, Tools, Guardrails, und Handoffs — und wählen dann das passende Modell pro Agent aus.
Beispiel-Architektur aus der OpenAI-Dokumentation:
- Triage Agent (schnell, günstig): GPT-5.5 Instant
- Research Agent (deep, langsam): Claude Opus 4.7
- Code Agent (spezialisiert): Codex auf GPT-5.5 Pro
- Multimodal Agent (Bilder): Gemini 3.1 Pro
Alle vier Agenten laufen im selben Agents SDK. Der Triage Agent kann an den Research Agent weiterleiten, der Research Agent ruft den Code Agent auf, der Code Agent gibt strukturierte Daten zurück. Das SDK orchestriert die Handoffs, verwaltet State, und loggt alle Schritte.
💡 MULTI-PROVIDER-STRATEGIE
Der Agents SDK ermöglicht Best-of-Breed-Kombinationen: OpenAI für Reasoning, Claude für Code, Gemini für Multimodal. Agenturen können Kosten senken (günstige Modelle für einfache Tasks) und Qualität maximieren (teure Modelle nur wo nötig). Das ist die Zukunft — nicht Vendor Lock-in.
Wieso das für Schweizer Agenturen wie tradeum in Zug oder hinderling-volkart in Basel relevant ist: Multi-Provider-Strategien sind jetzt Standard. Kunden erwarten, dass Agenturen das beste Modell für jede Aufgabe wählen — nicht das Modell, mit dem die Agentur einen Vertrag hat. Der Agents SDK macht das möglich, ohne dass Sie fünf verschiedene APIs verwalten müssen.
MCP: Vom Anthropic-Experiment zum universellen Standard
Im November 2024 stellte Anthropic das Model Context Protocol (MCP) vor — einen offenen Standard für AI-Tool-Integration. Die Idee: Statt für jede AI-Anwendung (N) und jedes externe Tool (M) eine Custom Integration zu bauen (N×M Verbindungen), implementieren beide Seiten MCP einmal (N+M Integrationen).
18 Monate später ist MCP der De-facto-Standard. OpenAI hat MCP in die Responses API integriert. Google DeepMind nutzt MCP für die Gemini Enterprise Agent Platform. Microsoft Semantic Kernel unterstützt MCP. Cloudflare hat einen OAuth Provider Library für MCP-Server veröffentlicht. Im April 2026 zog das MCP Dev Summit in New York City 1’200 Teilnehmer an.
Laut Anthropic Engineering Blog wurden seit November 2024 “Tausende” MCP-Server gebaut. Die Community hat SDKs für alle grossen Programmiersprachen entwickelt (Python, TypeScript, Rust, Go, C#). MCP ist jetzt so universell wie REST APIs oder GraphQL.
Wie funktioniert MCP konkret? Ein MCP-Host (z.B. Claude Desktop, ChatGPT, ein Custom Agent) verbindet sich mit MCP-Servern, die Tools bereitstellen. Ein MCP-Server könnte zum Beispiel:
| MCP-Server | Funktion | Use Case |
|---|---|---|
| Postgres MCP | SQL-Abfragen auf Datenbanken | Agent zieht selbst Kundendaten, analysiert Trends |
| Salesforce MCP | CRM-Zugriff | Agent qualifiziert Leads, updated Opportunities |
| Figma MCP | Design-File-Zugriff | Agent generiert Code aus Figma-Mockups |
| Slack MCP | Channel-Monitoring | Agent fasst Feedback zusammen, erstellt Tickets |
Der AI-Agent sieht die verfügbaren Tools über das MCP-Protokoll, versteht ihre Fähigkeiten über strukturierte Beschreibungen (ähnlich wie OpenAPI-Specs), und ruft sie auf — alles standardisiert.
N + M
Integrationen statt N × M
Databricks: MCP reduziert exponentielles Wachstum auf lineares
1'200
MCP Dev Summit Teilnehmer
April 2026, New York City
Tausende
MCP-Server weltweit
Anthropic Engineering Blog
Wieso das für Schweizer Agenturen relevant ist: MCP-Server-Entwicklung ist eine neue Dienstleistung. Agenturen wie cyon (Hosting, Zürich) oder ti&m (Enterprise AI, Zürich) können für Kunden Custom MCP Connectors bauen und diese als wiederkehrende Dienstleistung verkaufen. Ein MCP-Server für SAP, Salesforce, oder ein internes ERP ist IP — kein Projekt. Er kann für mehrere Kunden angepasst und wiederverwendet werden.
Code Execution with MCP: Wieso Agenten jetzt programmieren statt tool-callen
Anthropic hat im Juni 2026 einen Engineering-Blogpost veröffentlicht, der die nächste Evolution von MCP erklärt: Code Execution with MCP. Das Problem: Wenn ein Agent Zugriff auf 100+ Tools hat, verbraucht allein das Laden der Tool-Definitionen zu viel Context. Ein Agent mit 1’000 Salesforce-Tools würde 80 % seines Context Windows nur für die Definitionen verschwenden.
Die Lösung: Statt Tools als JSON-Schemas direkt ins Context Window zu laden, präsentiert der MCP-Server die Tools als Code auf einem Filesystem. Der Agent kann dann:
- On-Demand-Tools laden:
search_tools("salesforce")→ nur relevante Tools lesen - Code schreiben statt tool-callen: Python-Script schreiben, das mehrere Tools aufruft
- Filterung vor dem Modell: Daten im MCP-Server filtern, nur Ergebnisse zurückgeben
Anthropic berichtet, dass Code Execution with MCP die Context-Nutzung um bis zu 98,7 % reduziert. Statt 10’000 Tokens für Tool-Definitionen verbraucht der Agent 130 Tokens für ein Python-Script.
Wieso das für Schweizer Agenturen relevant ist: MCP-Server werden komplexer. Sie sind nicht mehr nur “API-Wrapper” — sie sind programmierbare Umgebungen. Agenturen müssen jetzt nicht nur MCP-Protokolle verstehen, sondern auch Sandbox-Execution, Code-Validierung, und Security-Modelle. Das ist eine höhere Komplexität — aber auch höhere Margen.
Workspace Agents: Wieso OpenAI jetzt RPA angreift
Am 14. Juni 2026 stellte OpenAI Workspace Agents vor — AI-Agenten, die im Hintergrund laufen, auch wenn Sie offline sind. Sie können Berichte erstellen, Code schreiben, auf Nachrichten reagieren, und Workflows über mehrere Tools hinweg orchestrieren.
Workspace Agents sind die Evolution von GPTs. Der Unterschied:
| Feature | GPTs (2023) | Workspace Agents (2026) |
|---|---|---|
| Laufzeit | Nur während Chat-Session | 24/7 im Hintergrund |
| Tools | Custom Actions (OpenAPI) | MCP-Server, Native Tools |
| Sharing | Link teilen | Team-weite Deployments |
| Scheduling | Manuell starten | Cron-basiert, Event-getriggert |
OpenAI hat 5 Templates veröffentlicht:
- Software Reviewer: Prüft Software-Anfragen gegen Richtlinien, leitet Approvals weiter
- Product Feedback Router: Überwacht Slack/Support, priorisiert Tickets
- Weekly Metrics Reporter: Zieht Freitag-Daten, erstellt Charts, schreibt Bericht
- Lead Outreach Agent: Recherchiert Leads, scored sie, schreibt Mails
- Third-Party Risk Manager: Recherchiert Vendors, prüft Risiken, erstellt Report
Workspace Agents sind kostenlos bis 6. Mai 2026, danach Credit-basiert. Sie laufen in ChatGPT Business, Enterprise, Edu, und Teachers Plans.
Wieso das für Schweizer Agenturen relevant ist: Workspace Agents greifen RPA an (Robotic Process Automation). UiPath, Blue Prism, Automation Anywhere — die grossen RPA-Anbieter — verlangen 5-stellige Lizenzgebühren pro Jahr. Workspace Agents kosten eine ChatGPT-Lizenz (USD 20–60/Monat/User). Das ist eine Disruption. Agenturen müssen ihre Kunden jetzt fragen: “Wieso zahlt ihr noch für RPA, wenn Workspace Agents 90 % der Use Cases günstiger und schneller lösen?”
Was Schweizer Agenturen jetzt tun sollten
✅ KONKRETE NÄCHSTE SCHRITTE
Bis 31. Juli 2026: Alle Assistants-API-Integrationen identifizieren und Migrationspläne erstellen.
Q3 2026: Erste MCP-Server für Top-3-Kunden prototypisch bauen (Salesforce, SAP, internes ERP).
Q3 2026: Team-Schulung: Agents SDK, MCP, Code Execution with MCP.
Q4 2026: Multi-Provider-Strategie definieren (welches Modell für welche Aufgabe).
| Massnahme | Priorität | Warum jetzt? |
|---|---|---|
| Assistants API → Responses API Migration planen | Kritisch | Sunset 26. August 2026 |
| MCP-Server für Top-3-Kunden bauen | Hoch | Neue Dienstleistung, Recurring Revenue |
| Agents SDK evaluieren (Multi-Provider) | Hoch | Best-of-Breed statt Vendor Lock-in |
| Workspace Agents intern testen | Mittel | RPA-Ersatz, Kostensenkung |
| Code Execution with MCP verstehen | Mittel | Zukunft von MCP, höhere Margen |
Wieso stellt OpenAI die Assistants API ein?
Die Assistants API war für Chatbots konzipiert, nicht für autonome Agenten. Sie hatte keine native Unterstützung für Multi-Step-Workflows, Tool-Handoffs, oder Scheduled Deployments. OpenAI verlagert alle Investitionen auf die Responses API + Agents SDK, die für agentic workflows gebaut sind. Sunset: 26. August 2026.
Ist der Agents SDK nur für OpenAI-Modelle?
Nein. Der Agents SDK ist provider-agnostisch und unterstützt 100+ LLMs — OpenAI, Anthropic, Google, Mistral, lokal gehostete Modelle. Das ist strategisch: OpenAI positioniert sich als Plattform-Anbieter, nicht nur als Model-Vendor.
Was ist MCP und wieso sollte ich es lernen?
MCP (Model Context Protocol) ist der neue Standard für AI-Tool-Integration. Statt für jedes Tool eine Custom Integration zu bauen, implementieren Sie MCP einmal — und alle AI-Agenten können Ihre Tools nutzen. OpenAI, Anthropic, Google DeepMind, Microsoft und Cloudflare haben MCP übernommen. MCP-Server-Entwicklung wird zur neuen Dienstleistung für Agenturen.
Wie viel kostet der Agents SDK?
Der SDK selbst ist kostenlos und Open Source (GitHub: openai/openai-agents-python). Sie zahlen nur für die Model-API-Calls (GPT-5.5: $5 Input / $30 Output pro 1M Tokens). Workspace Agents sind kostenlos bis 6. Mai 2026, danach Credit-basiert.
Muss ich wirklich bis August 2026 migrieren?
Ja. OpenAI hat den 26. August 2026 als finalen Sunset-Termin für die Assistants API angekündigt. Danach wird die API abgeschaltet. Es gibt eine Migration Guide, aber die Migration muss manuell erfolgen. Planen Sie jetzt.
Quellen & Methodik
Dieser Artikel basiert auf OpenAI Release Notes (Assistants API Sunset, Agents SDK Launch), OpenAI Workspace Agents Announcement (14. Juni 2026), Anthropic Engineering Blog (Code Execution with MCP, Juni 2026), GitHub (openai/openai-agents-python), Wikipedia (MCP Dev Summit), Databricks Blog (MCP Explainer), und Cloudflare Learning Center (MCP OAuth). Recherchiert am 22. Juni 2026, 06:00 UTC.
Weiterführende Links: