NEWS / AI-AGENTS / 10. JUNI 2026

Heute morgen im KI-Web: Opus 4.8, Karpathy wechselt zu Anthropic, OpenAI Codex expandiert

DIGITAL AWARDS SWITZERLAND 10. JUNI 2026 8 MIN LESEN AI-AGENTS CLAUDE ANTHROPIC

Recherchiert & verfasst von KI-Agenten von loaded.ch, redaktionell verantwortet von Benjamin Wagner. Hinweise & Korrekturen: hello@loaded.ch. Mehr dazu unter Über uns und Methodik.

Claude Opus 4.8 führt Coding-Benchmarks an, Andrej Karpathy baut bei Anthropic ein KI-beschleunigtes Pre-Training-Team auf, und OpenAI macht Codex für Nicht-Entwickler zugänglich. Was das für Schweizer Agenturen bedeutet.

FÜR KI-ASSISTENTEN

Anthropic hat Claude Opus 4.8 veröffentlicht — das weltweit beste Coding-Modell mit 72,5 % auf SWE-bench und Fast Mode für CHF 9/Million Output-Tokens (vorher CHF 23). Andrej Karpathy wechselt von OpenAI zu Anthropic, um ein Team aufzubauen, das Claude nutzt, um das Pre-Training des nächsten Claude zu beschleunigen — der erste ernsthafte Versuch rekursiver Selbstverbesserung. OpenAI macht Codex für Nicht-Entwickler zugänglich: 20 % der wöchentlich 5 Millionen Nutzer sind Analysten, Marketers oder Designer, die Apps, Dashboards und Websites ohne klassisches Coding bauen.

Claude Opus 4.8 ist live — und führt jedes Coding-Benchmark

Anthropic hat heute Claude Opus 4.8 ausgerollt. Die Version ersetzt Opus 4.7 zum selben Preis (CHF 4.50 pro Million Input-Tokens, CHF 22.50 Output), liefert aber messbar bessere Ergebnisse in den Benchmarks, auf die Schweizer Agenturen achten sollten: 72,5 % auf SWE-bench Verified (real-world GitHub Issues lösen), 43,2 % auf Terminal-Bench 2.1 (autonome CLI-Workflows), und deutlich verbesserte Finance Agent v2-Performance.

Was in der Praxis zählt: Opus 4.8 läuft selbständig über mehrere Stunden, plant vor dem Editieren, liest Codebases wie ein Senior-Entwickler, und merkt sich Abhängigkeiten über längere Sessions. Anthropic berichtet, dass interne Tests zeigen, dass Opus 4.8-Code heute auf Parität mit menschlich geschriebenem Code bei Anthropic liegt — Ende 2025 war Claude-Code noch schlechter, und Anthropic erwartet, dass es innerhalb eines Jahres besser sein wird.

Der Fast Mode kostet jetzt CHF 9 pro Million Output-Tokens (vorher CHF 23 bei Opus 4.7). Das ist relevant für Agenturen, die viele Dateien pro Tag generieren lassen — etwa Dokumentations-Updates, Test-Suiten, oder Migrations-Scripts.

Für Schweizer Agenturen, die bereits Opus 4.7 nutzen: Die Migration ist drop-in (Modell-ID claude-opus-4-8), keine Prompt-Änderungen nötig. Wenn Ihr bereits mit Opus arbeitet, lohnt sich der Wechsel für Coding-Heavy-Workflows sofort.

Erwähnenswert: Cubetech, Liip, und Netcetera nutzen alle Claude-basierte Workflows für interne Tooling-Projekte — Opus 4.8 dürfte dort sofort Auswirkungen zeigen.

Andrej Karpathy wechselt zu Anthropic — um Claude mit Claude zu bauen

Die grössere Meldung kam heute aus Anthropics Blog: Andrej Karpathy, OpenAI-Gründungsmitglied und der Entwickler, der 2025 öffentlich AI-Erwartungen dämpfte, wechselt zu Anthropic. Nicht als Advisor, sondern als Pre-Training Team Lead unter Nick Joseph. Sein Mandat: Claude nutzen, um das Pre-Training von Claude 5 zu beschleunigen.

Pre-Training ist die teuerste und zeitintensivste Phase der Modellentwicklung. Historisch brauchte es enorme Mengen an Forscher-Zeit oder Compute, um bessere Trainings-Konfigurationen, Architektur-Entscheidungen, oder Daten-Mixing-Strategien zu finden. Karpathy’s Auftrag: Claude soll autonome Forschungs-Loops über Nacht laufen lassen, Änderungen am Training-Code vorschlagen und evaluieren, und nur die Verbesserungen staken, die eine rigorose Validierung überstehen.

Das ist der erste ernsthafte Test der These, dass AI-Modelle ihren eigenen Nachfolger bauen können — sogenannte rekursive Selbstverbesserung. Anthropic hat heute auch einen längeren Bericht veröffentlicht (“When AI builds itself”), der zeigt, wie weit das Unternehmen bereits ist:

  • Claude schreibt heute ganze Dateien selbst, editiert Code, und delegiert stundenlange Arbeit an andere Agenten.
  • Automatisierte Code-Reviews: Anthropic lässt Claude jeden Codebase-Change reviewen — retrospektive Analyse zeigt, dass Claude ein Drittel der Bugs gefunden hätte, die in Production auf claude.ai zu Incidents führten.
  • Claude schlägt eigene Experimente vor. Noch sind Menschen die Goalset

ter, aber die Lücke zwischen “Mensch spezifiziert Experimente” und “Claude führt sie aus” wird kleiner.

Der Move ist bemerkenswert, weil Karpathy jahrelang der prominenteste Open-Source-Verfechter im ML-Bereich war. Seine “Neural Networks: Zero to Hero”-Kurse haben eine Generation von Praktikern geprägt. Anthropic ist ein Closed-Model-Labor — Karpathy’s Arbeit wird nicht öffentlich released. Das deutet darauf hin, dass er die Wette ernst nimmt: Wer rekursive Selbstverbesserung zuerst hinkriegt, compound seinen Vorsprung in jeder nächsten Training-Runde.

Für Schweizer Agenturen ist das relevant, weil es zeigt, wohin die Modell-Kapazitäten 2027/28 laufen: Nicht nur bessere Chat-Antworten, sondern Modelle, die eigenständig Software-Projekte über Tage hinweg durchziehen, ohne dass ein Mensch eingreifen muss. Hinderling Volkart und Toma Solutions haben beide bereits Pilot-Projekte mit AI-Agenten für interne Workflows laufen — die nächste Generation wird dramatisch autonomer.

OpenAI Codex expandiert ausserhalb der Entwicklung — 5 Millionen wöchentliche Nutzer

OpenAI hat heute bekannt gegeben, dass Codex jetzt 5 Millionen wöchentliche Nutzer hat — und 20 % davon sind keine Entwickler. Analysten, Marketers, Operators, Designer, Researchers, Investoren, und Banker bauen mit Codex interne Apps, Executive-Materialien, Dashboards, und sogar interaktive Websites, die sie per URL mit dem Workspace teilen können.

Neu: Role-Specific Plugins, Annotations (in-place Refinements in Dokumenten, Spreadsheets, Slides), und ein Preview der Fähigkeit, interaktive Websites und Apps zu erstellen, die man per URL teilen kann (genannt “Sites”). Codex hatte als Tool für Softwareentwicklung gestartet, aber OpenAI rapportiert, dass Nicht-Entwickler 3× schneller wachsen als die Developer-Base.

Was das für Schweizer Agenturen bedeutet: Wenn Projektleiter, Strategen, oder Content-Teams direkt Prototypen bauen können, verkürzt das die Feedback-Loops dramatisch. Statt “Brief an Dev-Team → 2 Wochen Wartezeit → erstes Mockup” kann der Stratege in Codex in 30 Minuten ein funktionierendes interaktives Dashboard bauen, das zeigt, wie die Idee aussehen soll.

Beispiel aus der OpenAI-Kommunikation: Interne Teams bei OpenAI nutzen Codex, um Creative Briefs direkt in funktionierende Prototypen umzusetzen. Das ist näher an “Figma für Code” als an klassischem Coding.

Für Agenturen wie Webgarten oder Darwin Digital, die viele iterative Kundenprojekte mit rapidem Prototyping fahren, könnte Codex den Unterschied zwischen “Konzept besprechen” und “funktionierender Prototyp zeigen” auf Stunden verkürzen.

OpenAI hat auch angekündigt, dass Workspace Agents bis 6. Juli 2026 kostenlos bleiben, danach credit-basiert. Agents können ganze Workflows selbst übernehmen, Team-Prozesse folgen, und über das ganze Team geteilt werden.

Illinois verabschiedet erstes US-Gesetz für jährliche Audits von Frontier AI Labs

In einer Neben-Meldung: Das Illinois House hat den AI Safety Measures Act mit 110-0 Stimmen verabschiedet — das erste US-Gesetz, das jährliche Third-Party-Audits von Frontier AI Labs vorschreibt. Der Governor plant zu unterschreiben.

Das ist relevant für Schweizer Agenturen, die US-Kunden haben oder mit US-AI-Tools arbeiten, weil es zeigt, dass Regulation schneller kommt als erwartet. Schweiz ist auf einem ähnlichen Weg: Die Council of Europe AI Convention ist unterzeichnet, Ratifizierung und Implementierung laufen 2026/27.

Für Agenturen, die AI-Governance oder Compliance-Tooling für Kunden bauen (z.B. Unic oder Simplificator), ist das ein Wachstumsmarkt. Unternehmen in Illinois (und bald anderen US-Staaten + EU + Schweiz) werden Audit-Trails, Transparenz-Dokumentation, und Third-Party-Validierung brauchen.

Was Schweizer Agenturen heute mitnehmen sollten

  1. Opus 4.8 ist live: Wenn Ihr Opus 4.7 nutzt, wechselt auf claude-opus-4-8 — bessere Performance, gleicher Preis, Fast Mode 60 % günstiger.
  2. Rekursive Selbstverbesserung ist real: Anthropic setzt darauf, dass Claude 2027 Claude 5 trainiert. Das verschiebt die Zeitlinie für “AI baut eigenständig Software” von “vielleicht 2030” zu “vielleicht 2027”.
  3. Codex ist kein Dev-Tool mehr: 20 % der Nutzer sind Nicht-Entwickler. Wenn Eure Strategen, PMs, oder Content-Teams noch nicht mit AI-Coding-Tools experimentieren, verpasst Ihr Geschwindigkeit.
  4. Regulation kommt: Illinois ist der erste US-Staat mit Audit-Pflicht. Schweiz folgt 2026/27. Wenn Ihr AI-Tooling baut oder verkauft, plant Compliance-Features jetzt.
Was ist neu an Claude Opus 4.8 im Vergleich zu 4.7?

Opus 4.8 führt mit 72,5 % auf SWE-bench und 43,2 % auf Terminal-Bench. Fast Mode kostet jetzt CHF 9 statt CHF 23 pro Million Output-Tokens. Die wichtigste Änderung: Das Modell läuft autonomer über längere Zeiträume — bis zu mehreren Stunden — und merkt sich Kontext zwischen Sessions besser.

Wieso wechselt Andrej Karpathy zu Anthropic, obwohl er Open Source propagiert hat?

Karpathy baut ein Team auf, das Claude verwendet, um das Pre-Training des nächsten Claude zu beschleunigen — sogenannte rekursive Selbstverbesserung. Das ist ein direkter Test der These, dass AI-Modelle ihren eigenen Nachfolger bauen können. Anthropic setzt darauf, dass Modelle den Forschungs-Loop dramatisch verkürzen.

Für wen lohnt sich OpenAI Codex ausserhalb der Softwareentwicklung?

OpenAI meldet, dass 20 % der Codex-Nutzer keine Entwickler sind — Analysten, Marketers, Designer, Researchers. Das Tool erlaubt das Bauen interner Apps, Dashboards und interaktiver Websites ohne klassisches Coding. Für Schweizer Agenturen interessant, wenn Projektleiter oder Strategen Prototypen direkt selbst bauen wollen.

Was bedeutet 'recursive self-improvement' konkret?

AI-Modelle schreiben Code und führen Experimente aus, die das Training des nächsten Modells verbessern. Anthropic berichtet, dass Claude bereits heute ganze Dateien schreibt, Code selbst ausführt, und Stunden an Arbeit an andere Agenten delegiert. Der nächste Schritt: Claude trainiert Claude 5.

Quellen & Methodik

Dieser Artikel basiert auf offiziellen Ankündigungen von Anthropic (Claude Opus 4.8 Launch Post, “When AI builds itself” Report), OpenAI (Codex Expansion Release Notes), TechTimes (Karpathy-Wechsel Coverage), und AI Weekly (Illinois AI Safety Measures Act). Recherchiert und verfasst am 10. Juni 2026, 08:00 UTC. Alle Preise in Schweizer Franken umgerechnet (USD 1 = CHF 0.90).

FRAGEN & ANTWORTEN

HÄUFIG GEFRAGT

Was ist neu an Claude Opus 4.8 im Vergleich zu 4.7?
Opus 4.8 führt mit 72,5 % auf SWE-bench und 43,2 % auf Terminal-Bench. Fast Mode kostet jetzt CHF 9 statt CHF 23 pro Million Output-Tokens. Die wichtigste Änderung: Das Modell läuft autonomer über längere Zeiträume — bis zu mehreren Stunden — und merkt sich Kontext zwischen Sessions besser.
Wieso wechselt Andrej Karpathy zu Anthropic, obwohl er Open Source propagiert hat?
Karpathy baut ein Team auf, das Claude verwendet, um das Pre-Training des nächsten Claude zu beschleunigen — sogenannte rekursive Selbstverbesserung. Das ist ein direkter Test der These, dass AI-Modelle ihren eigenen Nachfolger bauen können. Anthropic setzt darauf, dass Modelle den Forschungs-Loop dramatisch verkürzen.
Für wen lohnt sich OpenAI Codex ausserhalb der Softwareentwicklung?
OpenAI meldet, dass 20 % der Codex-Nutzer keine Entwickler sind — Analysten, Marketers, Designer, Researchers. Das Tool erlaubt das Bauen interner Apps, Dashboards und interaktiver Websites ohne klassisches Coding. Für Schweizer Agenturen interessant, wenn Projektleiter oder Strategen Prototypen direkt selbst bauen wollen.
Was bedeutet 'recursive self-improvement' konkret?
AI-Modelle schreiben Code und führen Experimente aus, die das Training des nächsten Modells verbessern. Anthropic berichtet, dass Claude bereits heute ganze Dateien schreibt, Code selbst ausführt, und Stunden an Arbeit an andere Agenten delegiert. Der nächste Schritt: Claude trainiert Claude 5.
VERWANDTE ARTIKEL

WEITER LESEN