Ein Drittel der neuen Websites ist KI-generiert

KI-generierte Texte im Internet von Mitte 2022 bis Mitte 2025. Die Abbildung zeigt den Anteil der Websites, die laut Studie als vollständig KI-generiert (rot) oder als KI-unterstützt (lila) eingestuft wurden. Quelle: Dolezal et. Al 2026

Bis Mitte 2025 sind rund 35 Prozent aller neu veröffentlichten Websites mit Hilfe von Künstlicher Intelligenz (KI) erstellt worden. Das zeigt eine Analyse von Forschenden der Universitäten Stanford und Imperial College London sowie des Internet Archive. Die Fachleute untersuchten repräsentative Stichproben aus dem Internet Archive aus den Jahren 2022 bis 2025. Das Team nutzte für die Untersuchung einen Detektor der Firma Pangram Labs. Der Anteil solcher Inhalte lag vor dem Start von ChatGPT Ende 2022 noch bei nahezu Null.

Die Verbreitung von KI-Texten führt laut der Untersuchung zu einer messbaren Verringerung der semantischen Vielfalt im Netz. Die Texte ähneln sich inhaltlich stärker als von Menschen verfasste Beiträge. Zudem korreliert die Zunahme von KI-Inhalten mit einer Zunahme an positiver Stimmung. Jonas Dolezal vom Imperial College London und seine Kollegen bezeichnen das als künstlichen Positivitätsschub. Die Texte wirken dadurch oft übertrieben optimistisch oder glattgebügelt.

Das steht im Gegensatz zur öffentlichen Wahrnehmung. Eine begleitende Befragung von Erwachsenen und den USA ergab, dass eine Mehrheit negative Auswirkungen auf die Faktentreue befürchtet. Die statistische Analyse der Webdaten lieferte dafür jedoch keine Belege. Auch für eine Vereinheitlichung von Schreibstilen fanden die Forschenden keine signifikanten Beweise. Menschen, die KI-Werkzeuge selten nutzen, äusserten stärkere Bedenken gegenüber der Technologie.

Gefahr für künftige Modelle

Die vielen KI-Inhalte könnten aber negative Folgen für künftige KI-Modelle haben. Die Forschenden warnen deshalb vor den Folgen für die weitere KI-Entwicklung. Wenn der Anteil der KI-generierten Inhalte im Netz zunimmt, werden neue Modelle zunehmend mit Daten trainiert, die von anderen KIs generiert wurden. Das erhöht das Risiko eines Modellkollapses. Zukünftige Basismodelle könnten dadurch an Qualität verlieren. Die Studie empfiehlt deshalb neue Standards zur Verifizierung menschlicher Urheberschaft.

Ein reiner Fokus auf die Detektion von KI-Inhalten reicht laut den Autoren nicht aus. Solche Methoden könnten mit der Zeit unzuverlässiger werden. Stattdessen schlagen sie kryptografische Verfahren vor, um die Herkunft von Inhalten nachzuweisen. Auch Suchalgorithmen sollten angepasst werden. Diese müssten semantische Vielfalt und verifizierte menschliche Quellen stärker belohnen.

Quelle

Dolezal, J., Alam, S., Graham, M. & Bohacek, M., «The Impact of AI-Generated Text on the Internet», 2026, ai-on-the-internet.github.io/ai-on-the-internet.pdf

Gefahr für künftige Modelle

Antwort abbrechen