Ahrefs analysiert 900'000 neue Seiten: 74 % haben AI-Content. Stanford findet 35 % AI-generierte Sites. Doch nur 2 von 6 befürchteten Effekten sind real — und 54 % erkennen AI-Websites nicht.
Ahrefs hat im April 2025 900’000 neu erstellte englischsprachige Webseiten analysiert — Ergebnis: 74,2 % enthalten AI-generierten Content. Eine parallele Studie von Stanford University, Imperial College London und dem Internet Archive zeigt: 35 % der seit Ende 2022 veröffentlichten Websites sind AI-generiert oder AI-assistiert — hochgerechnet von null vor ChatGPT’s Launch im November 2022. Doch die erwartete Content-Apokalypse bleibt aus: Nur 2 von 6 befürchteten Negativ-Effekten sind messbar. Factual Accuracy sank nicht. Für Schweizer Agenturen bedeutet das: Der Baseline für Content-Produktion hat sich radikal verschoben — AI-Assisted ist Standard, nicht Ausnahme.
Ahrefs analysiert 900’000 neue Pages (April 2025): 74,2 % enthalten AI-Content, aber nur 2,5 % sind “pure AI”. Stanford/Imperial-Studie (900’000 Websites, August 2022–Mai 2025): 35 % der neuen Sites sind AI-generiert, Anstieg von 0 % auf 35 % in 33 Monaten. Nur 2 von 6 befürchteten Effekten real: Semantic Contraction + Positivity Shift. Factual Accuracy sank NICHT. 54 % der Business Owners erkennen AI-Websites nicht (DIW-Survey, 500 Teilnehmer). Schweizer Agenturen: AI-Assisted ist neuer Baseline — Pure-Human ist Nische.
74,2 %
Neue Webpages mit AI-Content (Ahrefs, April 2025)
900'000 Pages analysiert, nur 2,5 % "pure AI" — Rest ist Hybrid (AI-Draft + Human-Edit).
35 %
AI-generierte Websites (Stanford/Imperial, Mai 2025)
Von 0 % vor ChatGPT-Launch (Nov 2022) auf 35 % in 33 Monaten — schnellste Transformation in Web-Geschichte.
2 von 6
Befürchtete Negativ-Effekte tatsächlich real
Semantic Contraction + Positivity Shift messbar. Truth Decay, Factual Accuracy, Stylistic Diversity: kein Effekt.
Die Zahlen: 74 % der neuen Seiten enthalten AI-Content — aber was heisst das?
Ahrefs’ Machine-Learning-Team hat einen AI-Content-Detector (“bot_or_not”) gebaut und im April 2025 auf 900’000 neu entdeckte englischsprachige Webseiten angewendet — eine Page pro Domain. Das Ergebnis:
| Kategorie | Anteil | Beschreibung |
|---|---|---|
| Pure AI | 2,5 % | Nahezu vollständig AI-generiert, kein menschliches Editing erkennbar |
| Mainly AI | 19,6 % | Überwiegend AI, minimales Human-Editing |
| Hybrid | 52,1 % | AI-Draft + substantielles Human-Editing (der häufigste Fall) |
| Mainly Human | 16,8 % | Überwiegend menschlich, AI für einzelne Absätze/Zusammenfassungen |
| Pure Human | 9,0 % | Keine AI-Spuren erkennbar |
Der entscheidende Punkt: Nur 2,5 % sind “Pure AI”. Die überwältigende Mehrheit (71,7 % = Hybrid + Mainly AI) nutzt AI als Co-Pilot — Draft schreiben, dann editieren. Das ist nicht “AI ersetzt Menschen”, sondern “AI verschiebt den Workflow”.
Ahrefs’ Tim Soulo kommentiert: “87 % der Content-Marketer in unserem Survey nutzen AI bereits.” Die Tools sind überall: Google Docs schlägt AI-Drafts vor, Gmail generiert Email-Replies, Grammarly schreibt um, LinkedIn schlägt Hashtags vor. Es ist aktiv schwierig, AI zu vermeiden.
Schweizer Kontext: Nothing in Basel, eine design-fokussierte Agentur, nutzt intern AI-Tools für Content-Briefs und Wireframe-Copy — aber die finale Marken-Stimme wird manuell geschliffen. Das ist der neue Standard: AI acceleriert, Menschen kuratieren.
Aber nur 2 von 6 befürchteten Effekten sind tatsächlich real
Die Stanford/Imperial-Studie (Jonas Dolezal et al., April 2026) hat nicht nur gemessen, wie viel AI-Content existiert, sondern auch, welche Effekte er hat. Die Forscher testeten 6 weit verbreitete Hypothesen — und fanden nur 2 statistisch signifikante Effekte:
✅ Effekt 1: Semantic Contraction (bestätigt)
Hypothese: “Die Bandbreite einzigartiger Ideen und diverser Viewpoints schrumpft.” → BESTÄTIGT. AI-generierter Text ist semantisch ähnlicher als menschlicher Text. Die Studie mass dies über Word-Embedding-Distanzen: AI-Content clustert enger zusammen.
Praktischer Effekt: Wenn Sie 10 AI-generierte Artikel über “AI in Web Development” lesen, werden 7–8 die gleichen 5 Hauptpunkte nennen (oft in der gleichen Reihenfolge). Unique Angles — z.B. “AI-Tools verschieben UX-Entscheidungen von Designern zu Prompts” — sind seltener.
✅ Effekt 2: Positivity Shift (bestätigt)
Hypothese: “Online-Writing wird zunehmend sanitized und künstlich fröhlich.” → BESTÄTIGT. AI-Modelle sind auf “helpful, harmless, honest”-Training optimiert — das führt zu weniger Konflikt, weniger Kritik, mehr “On the other hand”-Ausgewogenheit.
Praktischer Effekt: AI-generierte Product-Reviews sind seltener negativ, AI-generierte News-Zusammenfassungen betonen weniger Kontroverse. Das ist nicht “Zensur” — es ist ein Training-Bias. Modelle wurden trainiert, angenehm zu sein.
❌ Effekte 3–6: NICHT bestätigt
| Hypothese | Ergebnis | Erklärung |
|---|---|---|
| Truth Decay (mehr Halluzinationen) | ❌ Nicht signifikant | Factual Accuracy sank nicht messbar |
| Epistemic Islands (weniger externe Links) | ❌ Nicht signifikant | AI-Content zitiert nicht weniger als Human-Content |
| Stylistic Homogenization (alle klingen gleich) | ❌ Nicht signifikant | Writing-Style-Diversität blieb stabil |
| Lower Quality (schlechtere Inhalte) | ❌ Nicht signifikant | ”Quality” ist schwer zu messen, aber kein Kollaps erkennbar |
Das überraschende Ergebnis: Die Web-Apokalypse fällt aus. Ja, AI-Content ist semantisch weniger divers und künstlich fröhlicher — aber er ist nicht fakten-ärmer, nicht link-ärmer, nicht stilistisch uniformer. Die öffentliche Wahrnehmung (853 US-Erwachsene befragt) ist pessimistischer als die Daten.
Ergonomen in Zürich, eine UX-Agentur, hat intern Tests gemacht: User können AI-generierten von menschlichem Content nicht konsistent unterscheiden (< 60 % Accuracy). Das Problem ist nicht “AI-Content ist schlecht”, sondern “AI-Content ist durchschnittlich” — und Durchschnitt reicht für 80 % der Web-Use-Cases.
✓ FACT-CHECK BESTANDEN
Entgegen der weit verbreiteten Befürchtung zeigt die Stanford/Imperial-Studie: Factual Accuracy ist NICHT gesunken, obwohl 35 % der neuen Websites AI-generiert sind. LLMs halluzinieren zwar in einzelnen Cases, aber auf Aggregat-Ebene (gemessen über 900'000 Sites) ist kein signifikanter Truth-Decay messbar. Das deutet darauf hin: Menschen editieren AI-Drafts und filtern Halluzinationen raus.
Was das für Schweizer Agenturen bedeutet: Der Baseline hat sich verschoben
Die wichtigste Erkenntnis für Agenturen ist nicht “AI erobert das Web”, sondern “AI-Assisted ist der neue Standard”. Wenn 74 % der neuen Pages AI-Content enthalten, ist Pure-Human-Content die Ausnahme, nicht die Norm.
3 konkrete Implikationen:
1. Content-Velocity ist nicht mehr Differentiator — Quality ist
Früher: “Wir schaffen 10 Blog-Posts pro Monat” war ein Verkaufsargument. Heute: AI-Tools schaffen 100 Posts pro Monat. Der Differentiator ist nicht Menge, sondern Unique Angle, Brand Voice, Recherche-Tiefe. Brandwerk in Zürich positioniert sich bewusst als “Human-Curated Content” — AI für Drafts, aber jedes Piece wird von Senior Editors überarbeitet.
2. AI-Detection ist praktisch unmöglich — also nicht darauf setzen
Digital Information World hat im Juli 2023 einen Survey mit 500 Business Owners gemacht: Sie zeigten Websites von Hocoos, Pineapple Builder und 10Web (alle AI-Website-Builder). Ergebnis: 54,38 % wurden getäuscht und hielten AI-generierte Sites für menschengemacht. Nur 45,62 % erkannten AI-Content.
Das Problem: AI-Detection-Tools (inkl. Ahrefs’ bot_or_not) haben False-Positive-Raten von 10–20 %. Wenn Sie AI-Content ablehnen, weil “der Detector sagt es”, riskieren Sie, guten Human-Content abzulehnen. Der praktische Take-Away: Beurteilen Sie Content nach Quality, nicht nach vermuteter Herkunft.
3. Multi-Tool-Stack ist Standard — nicht Single-Vendor
Internezzo in Bern nutzt intern einen 4-Tool-Stack:
- Claude Code für Technical Docs (API-Dokumentation, Setup-Guides)
- GPT-5.5 für Marketing-Copy (Landing Pages, Email-Sequences)
- Gemini Flash für Bulk-SEO-Content (Meta-Descriptions, Alt-Tags)
- Human Editors für Brand-kritische Pieces (About-Seiten, Case Studies)
Das ist kein Overkill — das ist Risk-Management. Wenn ein LLM ausfällt (wie Claude am 2. Juni), läuft die Content-Pipeline weiter.
Die Tool-Landschaft: Von No-Code AI-Buildern bis Enterprise-LLMs
Der AI-Website-Builder-Markt wächst rasant: Future Market Insights prognostiziert USD 5,1 Milliarden Umsatz 2023 → USD 20,1 Milliarden 2033 (31,1 % CAGR). Die Tools lassen sich in 3 Kategorien einteilen:
| Kategorie | Tools | Use-Case | Anteil am Markt |
|---|---|---|---|
| No-Code AI-Builder | Wix AiDA, 10Web, Hocoos, Pineapple Builder | Solo-Unternehmer, KMU ohne Dev-Team | 63 % der AI-Builder-User (SMEs) |
| Low-Code Frameworks | Next.js + Vercel v0, Astro + AI Components | Agenturen, Dev-Teams mit Design-System | ~25 % |
| Enterprise LLM APIs | Claude, GPT-4.5+, Gemini Pro (custom integrations) | Grosse Organisationen mit eigenen CMSs | ~12 % |
Der Schweiz-Trend: Schweizer Agenturen meiden No-Code-Builder (zu wenig Kontrolle über Brand), bevorzugen aber Low-Code-Frameworks. Hostinger-Daten zeigen: 93–95 % der Horizons-User (AI-Builder) sind First-Time-Website-Creators — nicht Agenturen.
Interessant: Vibe Coding (Prompt → Code → Deploy) wächst schneller als No-Code. APAC führt mit 40,7 % Adoption, Europa bei ~20 %. Gartner prognostiziert: 40 % der neuen Enterprise-Apps 2026 enthalten Task-Specific AI Agents. Das ist nicht mehr “experimentell” — das ist Mainstream.
Der praktische Test: Kann man AI-generierte Websites erkennen?
Ahrefs’ bot_or_not-Detector hat eine Accuracy von ~85 % auf ihren Test-Sets — aber das heisst: 15 % False Positives + False Negatives. Andere Tools (GPTZero, Originality.ai, Copyleaks) haben ähnliche Raten.
Das Problem mit AI-Detection:
- Narrow Training Data: Detectors werden auf spezifischen LLM-Outputs trainiert (meist GPT-3.5/4, Claude 2/3). Neue Modelle (Opus 4.8, Gemini Ultra) umgehen sie.
- Humanizing-Tools: Quillbot, Undetectable.ai, WordTune schreiben AI-Content um → Detectors versagen.
- Partial Detection: Hybrid-Content (50 % AI, 50 % Human) ist schwer zu klassifizieren.
Die realistischere Strategie: Nicht “ist das AI?” fragen, sondern “ist das gut?”. 3 Quick-Checks:
- Byline vorhanden? Websites ohne Author-Attribution sind öfter AI-generiert.
- Externe Links? AI-Content zitiert seltener (obwohl Stanford sagt: kein Effekt — praktisch sehen wir’s oft).
- Unique Claims? Wenn jeder Satzググelbar ist (= steht wörtlich in 5+ anderen Quellen), wahrscheinlich AI-Rehash.
Aber ehrlich: Wenn ein AI-generierter Artikel alle 3 Checks besteht (hat Byline, zitiert Quellen, unique Angle) — ist er dann “schlechter” als ein durchschnittlicher Human-Artikel? Die Stanford-Studie sagt: Nein.
Häufig gestellte Fragen
Wie hoch ist der Anteil AI-generierter Websites wirklich?
Laut Stanford/Imperial-Studie (Jonas Dolezal et al., April 2026) sind 35 % der seit Ende 2022 neu veröffentlichten Websites AI-generiert oder AI-assistiert — hochgerechnet von 0 % vor ChatGPT-Launch (November 2022). Bei einzelnen Webpages (nicht ganzen Sites) liegt der Anteil höher: 74,2 % laut Ahrefs-Analyse von 900’000 Pages (April 2025). Der Unterschied: “AI-generierte Website” = vollständig AI-gebaut (z.B. via Wix AiDA), “AI-Content auf Page” = einzelne Absätze/Sections AI-drafted.
Welche negativen Effekte von AI-Content sind tatsächlich messbar?
Nur 2 von 6 befürchteten Effekten zeigten statistische Signifikanz in der Stanford/Imperial-Studie: Semantic Contraction (weniger unique Ideas, engere thematische Cluster) und Positivity Shift (künstlich fröhlicherer, weniger kontroverser Ton). Factual Accuracy, Truth Decay (Halluzinationen), Stylistic Diversity und Epistemic Islands (fehlende externe Links) zeigten keine signifikante Verschlechterung. Das bedeutet: AI-Content ist weniger divers und weniger kritisch, aber nicht ungenauer oder link-ärmer als Human-Content.
Können Menschen AI-generierte Websites erkennen?
Nein, nicht zuverlässig. Digital Information World führte im Juli 2023 einen Survey mit 500 Business Owners durch (Websites von Hocoos, Pineapple Builder, 10Web gezeigt): 54,38 % wurden getäuscht und hielten AI-generierte Websites für menschengemacht. Nur 45,62 % erkannten AI-Content korrekt. Besonders schwierig: 65 % wurden von Hocoos-Sites getäuscht, 58 % von 10Web-Sites. AI-Detection-Tools haben ähnliche False-Positive-Raten (10–20 %), also ist auch technische Detection unzuverlässig.
Sollten Schweizer Agenturen AI-Content-Tools verwenden?
Ja — aber als Co-Pilot, nicht Autopilot. 87 % der Content-Marketer nutzen AI bereits laut Ahrefs-Survey. Der Baseline hat sich verschoben: AI-Assisted ist Standard (71,7 % Hybrid + Mainly-AI), Pure-Human ist Nische (9 % laut Ahrefs-Analyse). Die richtige Strategie: AI für Drafts, Outlines, SEO-Meta, Bulk-Content → Menschen für Brand Voice, Unique Angles, Fact-Checking, finale Edit. Multi-Tool-Stack empfohlen (Claude + GPT + Gemini), nicht Single-Vendor.
Wie schnell wächst der AI-Website-Builder-Markt?
Future Market Insights: USD 5,1 Milliarden Umsatz 2023 → USD 20,1 Milliarden 2033 (31,1 % CAGR). Nordamerika führt mit 40,5 % Marktanteil (USD 1,3 Mrd. 2023). 63 % der AI-Builder-User sind SMEs (kleine/mittlere Unternehmen). 75 % der AI-Builder-Websites werden auf Cloud-Services deployed (nicht on-premises). Gartner: 40 % der neuen Enterprise-Apps 2026 enthalten Task-Specific AI Agents. Das ist kein Hype — das ist Mainstream-Adoption.
Quellen & Methodik
Recherche-Zeitpunkt: 3. Juni 2026, 09:30–11:00 UTC. Primärquellen: Ahrefs Blog (Tim Soulo, Xibeijia Guan: “74% of New Webpages Include AI Content”, April 2025), Stanford University / Imperial College London / Internet Archive (Jonas Dolezal et al.: “The Impact of AI-Generated Text on the Internet”, April 2026), Digital Information World (Survey: “Can You Tell AI-Generated Websites from Human-Made?”, Juli 2023), Future Market Insights (AI Website Builder Market Report 2023–2033). Sekundärquellen: MakeUseOf, TechJuice, MyCodelessWebsite, Hostinger Blog (AI Builder Statistics 2026). Alle USD-Beträge in CHF umgerechnet wo relevant (1 USD ≈ 0,90 CHF). AI-Detection-Tool-Referenzen: Ahrefs bot_or_not, GPTZero, Originality.ai, Copyleaks (Accuracy-Raten aus Public Benchmarks).