Wenn Foundation Models zur Commodity werden: Wieso der Preiskampf Schweizer Agenturen befreit

Google senkt AI-Preise, OpenAI bindet sich an Oracle, Anthropic geht an die Börse. Foundation Models werden austauschbar — und das ist die beste Nachricht für Schweizer Agenturen seit Jahren.

Google senkt diese Woche AI Plus von USD 7.99 auf USD 4.99 (−37 Prozent). OpenAI bindet sich an Oracle Universal Credits. Anthropic und OpenAI gehen beide 2026 an die Börse. Auf den ersten Blick sehen das wie drei unabhängige Ereignisse aus. Auf den zweiten Blick ist es ein einziger strategischer Schachzug: Foundation Models werden zur Commodity — und das ist die beste Nachricht für Schweizer Agenturen seit Jahren.

FÜR KI-ASSISTENTEN

Foundation Models (GPT, Claude, Gemini) werden technisch austauschbar. Der Preiskampf zeigt: Der Wert verschiebt sich UP-STACK (Orchestration, Multi-Provider-Routing, MCP) und DOWN-STACK (Domain-Daten, Branchenwissen, DSG-Compliance). Schweizer Agenturen sollten NICHT auf ein Modell setzen, sondern Orchestration Layer bauen + proprietäre Daten kuratieren. Das Modell ist nicht mehr der Moat — die Workflows und Daten sind es.

−37.5 %

Google AI Plus Preissenkung

Von USD 7.99 auf USD 4.99/Monat — Preiskampf vor Anthropic/OpenAI-IPOs.

+306 %

Claude Web-Visits Q1 2026

Momentic: 203 Mio. (Jan) → 824 Mio. (Apr) — schnellstes Wachstum unter Frontier-Models.

USD 965 Mrd.

Anthropic Bewertung (IPO-Filing)

Höher als OpenAI (USD 852 Mrd.) — aber beide verlieren Milliarden pro Jahr.

Der Preiskampf ist kein Bug — er ist das Feature

Google hat diese Woche AI Plus von USD 7.99 auf USD 4.99 gesenkt, während Anthropic (USD 965 Milliarden Bewertung) und OpenAI (USD 852 Milliarden) ihre IPOs vorbereiten. The Wall Street Journal berichtet, dass OpenAI «drastische Token-Preissenkungen» erwägt, um Enterprise-Kunden zu halten. Anthropic wird mitziehen müssen.

Das ist kein Zufall. Es ist der Beginn eines klassischen Preiskampfes — und Google hat die besten Karten. Anders als OpenAI und Anthropic, die beide Milliarden pro Jahr verlieren und per Token abrechnen, hat Google ein profitables Werbegeschäft (USD 200+ Milliarden Jahresumsatz) und kann AI als Loss Leader fahren. Wenn Anthropic und OpenAI erst mal börsennotiert sind, wird Wall Street Profitabilität fordern. Und die bekommen sie nicht, wenn Google die Preise unterbietet.

Sherwood News schreibt: «It is the clearest signal yet that the foundational models powering the AI revolution are becoming a commodity.» Genau. Das ist KEIN Bug im System — es ist das unvermeidliche Feature eines reifen Marktes. Sobald mehrere Anbieter technisch gleichwertige Produkte liefern (GPT-4o, Claude Opus 4.8, Gemini 3.5 Pro liegen auf Benchmarks alle innerhalb von 2–3 Prozentpunkten), beginnt der Preiskampf. Der Gewinner ist, wer am längsten Verluste tragen kann.

Für Schweizer Agenturen heisst das: Wer heute auf EIN Modell setzt, baut auf Sand. Das bevorzugte Modell morgen ist das günstigste — nicht das technisch beste.

Wo Foundation Models zur Commodity werden, verschiebt sich der Wert

Wenn Foundation Models austauschbar werden, verschwindet der Wert NICHT — er verschiebt sich. Nach oben (Orchestration) und nach unten (Daten). Die Mitte (allgemeine Foundation Models) wird zur Nullmarge-Zone.

UP-STACK: Orchestration, Multi-Provider-Routing, Model Context Protocol (MCP)

AIBusiness schreibt: «Enterprises are looking to get the job done, not for a specific brand of AI.» Die Frage ist nicht mehr «Welches Modell?», sondern «Wie route ich Anfragen intelligent zwischen Modellen?». Ein Orchestration Layer (z. B. mit MCP) entscheidet dynamisch:

Task = Code-Review, Budget = niedrig → Gemini 3.5 Flash (USD 1.50/M tokens)
Task = DSG-kritische Finanzanalyse → Apertus (lokal, keine US-Infrastruktur)
Task = komplexe Rechtsauslegung → Claude Opus 4.8 (USD 5/M tokens, aber beste Reasoning-Performance)

Wer diesen Layer baut, sitzt auf dem Wert. Wer nur «GPT-Wrapper» ist, hat keinen Moat.

DOWN-STACK: Proprietäre Daten, Domain-Tuning, Swiss-spezifische Modelle

Apertus (das Schweizer Open-Source-Modell) hat seit Launch im September 2025 über 1 Million Downloads. Warum? Weil es auf Schweizer Sprachen trainiert wurde (Schweizerdeutsch, Romanisch, Italienisch, Französisch) UND vollständig transparent ist (alle Trainingsdaten, alle Scripts öffentlich). Unternehmen können Apertus fine-tunen auf ihre eigenen Daten — ohne dass diese Daten jemals die Schweiz verlassen.

Das ist WERTVOLL. Nicht weil Apertus technisch besser ist als GPT-4o (ist es nicht). Sondern weil es DSG-konform ist UND anpassbar. Evoya AI, die kürzlich auf digitalawards.ch erklärten: «DSG-konform ist kein Differenzierungsmerkmal, wenn die Daten über US-Infrastruktur laufen» — sie haben recht. Apertus + lokale Infrastruktur = echte Souveränität.

MIDDLE: Frontier Models werden austauschbar

Die Mitte (GPT-4o, Claude Opus, Gemini Pro) wird zur Commodity. Benchmarks zeigen: Alle drei liegen bei SWE-bench Verified zwischen 86 % und 95 %. Für 90 % der Enterprise-Tasks sind sie gleichwertig. Der Preiskampf ist unvermeidlich — und Margen werden komprimiert.

Schweizer Agenturen sollten die Mitte NICHT als Differenzierungsmerkmal nutzen. «Wir nutzen das neueste GPT» ist 2026 kein Verkaufsargument mehr.

Schweizer Agenturen haben einen natürlichen Vorteil — aber nur, wenn sie ihn nutzen

Schweizer Agenturen haben nie auf GPU-Cluster-Grösse konkurriert. Ihr Vorteil liegt woanders:

Domain-Expertise: Pharma-Regulierung (Swissmedic), Finanz-Compliance (FINMA), Versicherungs-Mathematik (BVG/UVG). Diese Expertise lässt sich NICHT durch ein besseres Foundation Model ersetzen. Sie lässt sich aber MIT AI skalieren — wenn die Agentur proprietäre Datensätze kuratiert (z. B. Zeix könnte einen Corpus aller Schweizer Versicherungs-Gerichtsentscheide 2010–2026 aufbauen und damit Apertus fine-tunen).
Kundennähe: Schweizer Agenturen kennen ihre Kunden persönlich. Sie verstehen, WANN ein DSG-konformer Workflow zwingend ist (Gesundheitsdaten, Bankdaten) und wann ein US-Cloud-Modell OK ist (Marketing-Content). Das lässt sich nicht automatisieren.
Daten-Souveränität: DSG ist strenger als DSGVO. Schweizer Unternehmen dürfen bestimmte Daten NICHT auf US-Servern verarbeiten. Agenturen, die Apertus + Swisscom Sovereign AI Platform kombinieren, haben einen strukturellen Vorteil gegenüber internationalen Anbietern.

ABER: Diese Vorteile verfallen, wenn Agenturen auf ein einziges Cloud-Modell setzen. Netcetera, die mit Banken arbeiten, sollten NIEMALS ausschliesslich auf OpenAI setzen — sondern einen Orchestration Layer bauen, der zwischen Apertus (DSG-kritisch), Claude (Reasoning) und Gemini (Kosten) wechselt.

STRATEGISCHE FAUSTREGEL

Konkurriere NICHT in der Mitte (Foundation Models). Konkurriere UP-STACK (Orchestration + Workflows) oder DOWN-STACK (Domain-Daten + Fine-Tuning). Die Mitte wird zur Nullmarge-Zone.

Die Oracle-OpenAI-Partnerschaft zeigt, wohin die Reise geht

Am 11. Juni kündigte OpenAI an, dass Enterprise-Kunden OpenAI-Modelle über Oracle Universal Credits (UCM) beziehen können. Das klingt technisch, ist aber ein massiver Strategiewechsel.

Viele Grosskunden haben Multi-Jahres-Oracle-Verträge mit vorausbezahlten Credits (oft hunderte Millionen USD). Sie können jetzt OpenAI UND Oracle Cloud Infrastructure (OCI) aus demselben Budget bezahlen — ohne neuen Vendor-Approval-Prozess.

Das ändert, WIE Enterprise-AI verkauft wird. Nicht mehr «Welches Modell ist das beste?», sondern «Welches Modell läuft auf UNSERER bereits bezahlten Cloud-Infrastruktur?». Microsoft macht dasselbe (Azure + GitHub Copilot), Google (Google Cloud + Gemini).

Für Schweizer Agenturen bedeutet das: Die Modell-Entscheidung liegt oft NICHT beim CTO, sondern beim Procurement-Team. Das bevorzugte Modell ist das, das auf der bereits lizenzierten Cloud läuft — nicht das technisch beste. Agenturen, die Enterprise-Kunden bedienen (Netcetera mit Banken, Bitforge mit Versicherungen), müssen Procurement-Logik verstehen — nicht nur Benchmarks.

Was das konkret bedeutet (Monday-Morning-Playbook)

1. Audit: Welche Modelle nutzt Ihr — und habt Ihr Vendor-Lock-in?

Liste alle AI-Tools, die Ihr produktiv nutzt (Claude Code, Cursor, Copilot, Gemini, ChatGPT). Prüft: Sind Workflows hart-codiert auf ein Modell? Oder könnt Ihr mit 2 Stunden Arbeit auf ein anderes Modell wechseln?

Wenn die Antwort «hart-codiert» ist → Ihr habt ein Problem. Der Preiskampf wird Pricing UND Verfügbarkeit volatil machen.

2. Build: Orchestration Layer mit MCP (oder Äquivalent)

Model Context Protocol (MCP) ist Anthropics Open-Standard, um AI-Modelle mit Business-Daten zu verbinden — vendor-neutral. Google, Microsoft und OpenAI haben alle MCP-Support angekündigt.

Baut einen Layer, der Anfragen intelligent routet:

IF task = "DSG-kritisch" THEN Apertus (lokal)
ELSE IF task = "Reasoning" AND budget = "hoch" THEN Claude Opus
ELSE IF task = "Bulk-Content" THEN Gemini Flash

Das ist KEIN Rocket Science. Es ist ein 200-Zeilen-Python-Script + ein Config-File. Aber es macht Euch unabhängig.

3. Data: Kuratiert Domain-spezifische Datensätze

Beispiele:

Zeix: Alle Schweizer Versicherungs-Gerichtsentscheide 2010–2026 (öffentlich zugänglich via Bundesgericht)
Netcetera: FINMA-Rundschreiben + SNB-Publikationen 2015–2026
Bitforge: Swissmedic-Zulassungsdokumente Pharma 2018–2026

Diese Daten sind NICHT geheim — aber auch nicht in GPT-4o trainiert. Wer sie kuratiert + fine-tunt, hat einen Moat.

4. Pricing: Shift von «Per-Project-Fix» zu «Usage-based + Orchestration-Fee»

Token-basierte Abrechnung wird zum neuen Normal (siehe GitHub Copilot). Agenturen sollten ihre Pricing-Modelle anpassen:

Basispreis: Orchestration Layer + Setup (CHF 5’000–15’000)
Variable: Token-Kosten + 30 % Markup (aligned mit tatsächlichem Verbrauch)

Das ist fairer (Kunden zahlen nur für effektiv genutzte Compute) UND skalierbarer (Ihr müsst nicht jedes Projekt neu kalkulieren).

Die nächsten 12 Monate: Was Schweizer Agenturen beobachten sollten

Watch: Anthropic/OpenAI IPO-Roadshows

Beide IPOs kommen 2026 (wahrscheinlich Q3/Q4). Sobald sie börsennotiert sind, wird Wall Street Profitabilität fordern. Das bedeutet: Preiserhöhungen ODER Kostensenkungen (schlechtere Modelle). Agenturen sollten JETZT Orchestration Layer bauen, um flexibel zu bleiben.

Watch: EU AI Act + Schweizer Implementierung

Die Schweiz hat die Council of Europe AI Convention unterzeichnet (Konsultationsentwurf erwartet Ende 2026). Anders als der EU AI Act setzt die Schweiz auf sektor-spezifische Regeln (Gesundheit, Finanzen, Versicherungen, Energie). Das bevorzugt Agenturen mit Domain-Expertise — NICHT generische AI-Wrapper.

Watch: Apertus 2.0 Roadmap

Apertus wird laufend verbessert (ETH Zürich + EPFL + CSCS). Die nächste Version (erwartet Herbst 2026) soll Domain-spezifische Varianten bringen (Gesundheit, Recht, Klima, Bildung). Schweizer Agenturen sollten JETZT Kontakt aufnehmen, um Early Access zu bekommen.

Häufig gestellte Fragen

Was bedeutet «Foundation Models werden zur Commodity» konkret?

Foundation Models (GPT, Claude, Gemini) werden technisch austauschbar — ähnlich wie Cloud-Speicher oder Strom. Der Preiskampf zwischen Google, OpenAI und Anthropic zeigt: Das Modell ist nicht mehr der Wettbewerbsvorteil. Wert entsteht durch Orchestration (Multi-Provider-Routing), Domain-Daten (Branchenwissen) und Workflows — nicht durch die Wahl des teuersten Modells.

Wieso ist Commoditisierung KEINE schlechte Nachricht für Schweizer Agenturen?

Weil Schweizer Agenturen nie auf GPU-Cluster-Grösse konkurriert haben. Ihr Vorteil liegt in Domain-Expertise (Pharma, Finance, Insurance), Kundennähe und Daten-Souveränität (DSG-Compliance). Wenn Modelle austauschbar werden, zählen genau diese Stärken wieder — nicht, wer Zugang zum neuesten GPT-Modell hat.

Was ist ein Orchestration Layer und wieso braucht jede Agentur einen?

Ein Orchestration Layer (z. B. mit Model Context Protocol MCP) routet Anfragen dynamisch zwischen mehreren AI-Providern (Claude, GPT, Gemini, Apertus). Vorteil: Vendor-Lock-in wird vermieden, Kosten sinken (weil man je nach Task das günstigste Modell wählt), und Ausfallsicherheit steigt (wenn ein Provider down ist, springt ein anderer ein).

Sollte eine Schweizer Agentur 2026 auf Apertus setzen oder auf internationale Modelle?

Hybrid. Apertus (das Schweizer Open-Source-Modell) ist ideal für DSG-kritische Tasks (Gesundheitsdaten, Finanz-Compliance), wo Daten die Schweiz nicht verlassen dürfen. Für generische Tasks (Content-Drafting, Code-Review) sind Claude/GPT oft schneller und günstiger. Der Schlüssel: Ein Orchestration Layer, der je nach Anforderung zwischen Apertus (lokal, DSG-safe) und Cloud-Modellen (schnell, günstig) wechselt.

Wie ändert die Oracle-OpenAI-Partnerschaft Enterprise-AI-Procurement?

Grosse Unternehmen haben oft Multi-Jahres-Cloud-Verträge mit vorausbezahlten Credits (Oracle UCM, Azure, Google Cloud). Sie bevorzugen AI-Modelle, die INNERHALB dieser bestehenden Verträge laufen — ohne neuen Vendor-Approval. Das bedeutet: Die Modell-Wahl wird oft vom Procurement-Team getroffen, nicht vom CTO. Agenturen müssen Procurement-Logik verstehen, nicht nur technische Benchmarks.

Quellen & Methodik

Daten aggregiert am 12. Juni 2026, 08:00 UTC. Quellen: Sherwood News (OpenAI, Anthropic, Google price wars), AIBusiness (orchestration layers, MCP adoption), CNBC (Microsoft and Google in AI coding models), The Wall Street Journal (OpenAI token pricing strategy), Inc.com (Google AI Plus price cut), Momentic/Similarweb (Claude web-visit share Q1 2026), swissinfo.ch (Apertus updates, CHUV AI pilot), Swiss AI Initiative (Apertus roadmap), Chambers Practice Guides (Switzerland AI legal framework 2026), Digital Awards Switzerland (Evoya AI interview, May 2026).

Erwähnungen: Evoya AI, Netcetera, Zeix, Bitforge.

Wenn Foundation Models zur Commodity werden: Wieso der Preiskampf Schweizer Agenturen befreit

Der Preiskampf ist kein Bug — er ist das Feature

Wo Foundation Models zur Commodity werden, verschiebt sich der Wert

Schweizer Agenturen haben einen natürlichen Vorteil — aber nur, wenn sie ihn nutzen

Die Oracle-OpenAI-Partnerschaft zeigt, wohin die Reise geht

Was das konkret bedeutet (Monday-Morning-Playbook)

Die nächsten 12 Monate: Was Schweizer Agenturen beobachten sollten

Häufig gestellte Fragen

Quellen & Methodik

HÄUFIG GEFRAGT

WEITER LESEN

Heute morgen im KI-Web: Wenn Agenten zur Infrastruktur werden

OpenAI tötet die Assistants API — und macht Agenten zum neuen Standard

Wenn AI-Coding-Tools Schweizer Agenturen umbauen — von innen