Akzeptiert Google automatisierte Texte?

Automatisierte Texte – ein Verstoß gegen die Google Richtlinien?

Als größte Suchmaschine und wichtigste Traffic-Quelle sind Googles Richtlinien ein sehr relevanter Teil der täglichen Diskussion für Marketeers und SEOs. Letzte Woche hat die Stellungnahme von Google-Manager John Müller zu „KI-generierten Inhalten“ und deren Auswirkungen auf Websites eine Debatte über automatisch generierte Texte und die Frage, ob diese von Googles Webspam-Team als illegal angesehen werden, neu entfacht.

Die Kurzfassung: Der Mehrwert für den User entscheidet, ob Google Websites mit automatisiert erzeugten Texten abstraft oder nicht. Auch die aktuelle Welle von AI-Generierungstools hat keinen Einfluss auf diesen Grundsatz. Daher ist es aus SEO-Hinsicht kein Problem, mit AX Semantics erzeugte Texte (auch in sehr großen Stückzahlen) auf Websites zu veröffentlichen, solange sie den bekannten Qualitätsstandards entsprechen.

Trotzdem möchten wir uns die Diskussion und die Gründe dafür etwas genauer anschauen.

Die wichtigste Frage: Hat Google etwas an seinen Richtlinien in Bezug auf automatisierte Texte geändert?

Eine gewisse Aufregung gab es, als Google Manager John Müller Anfang April in einem Hangout zu Googles Haltung bezüglich AI-generiertem Content gefragt wurde. Seine Aussage war: “Wir betrachten AI-generierten Content als Verstoß gegen Webmaster-Richtlinien“ – und wurde vielfach als allgemeine Ablehnung von automatisierten Texten verstanden. Wir haben deshalb nochmal einen Blick in die Google Webmaster Richtlinien geworfen. Diese zeigen ganz deutlich: Die Haltung von Google gegenüber automatisierten Texten hat sich nicht geändert.

Keine Änderung der Google Webmaster Richtlinien – bestraft wird nach wie vor die manipulative Absicht

In den Webmaster-Richtlinien, die Müller als ausschlaggebend anführt, heißt es nach wie vor, dass automatisierte Texte dann ein Problem sind, wenn sie eine manipulative Absicht haben und nicht dafür erstellt wurden, Nutzern einen Mehrwert zu bieten. “Wenn Suchrankings manipuliert werden sollen und Inhalte nicht dazu gedacht sind, Nutzern zu helfen, kann Google entsprechende Maßnahmen bezüglich dieser Inhalte ergreifen.” 

Schlechte Inhalte und Spam sind das Problem, nicht die Automatisierung an sich

Google hat also im Augenblick nicht die Absicht, auf technischem Weg automatisierten Inhalt zu erkennen. Vielmehr nutzt die Suchmaschine für diese Art von Texten die inhaltlichen und formalen Spam-Kriterien, wie sie auch für handgeschriebene Texte gelten.

Tatsächlich wäre es zwar technisch möglich, Texte zu identifizieren, die von großen Sprachmodellen erzeugt wurden, nicht aber Texte, die von Data-to-Text Lösungen wie AX Semantics geniert wurden. Nur die herkömmlichen Spam-Indizien, wie eben schlechte sprachliche Qualität oder inhaltsloser Sprachmüll, könnten hier erkannt werden. Für Texte, die mit der Ausrichtung auf den User-Mehrwert generiert werden, wie es z.B. auf Produktbeschreibungen oder automatisierte News und Wettertexte zutrifft, besteht keine Gefahr für eine Google-Abstrafung. Auch das gleichzeitige Veröffentlichen großer Textmengen toleriert Google, solange es sich eben nicht um Spam handelt. 

Grund für die aufkommende Diskussion: AI-Hype durch GPT-3 Tools, die keinen regelbasierten Ansatz haben

Aufgekommen sein dürfte die aktuelle Diskussion aufgrund der vielfachen Nutzung von neuen GPT-3 Tools. Hierbei ist es nochmal wichtig, den Unterschied zwischen GPT-3 und dem Data-to-Text-Ansatz von AX Semantics herauszustellen. 

GPT und andere große Sprachmodelle

Data-to-Text

GPT (Generative Pre-trained Transformer) basieren auf großen Sprachmodellen, die mit Deep Learning trainiert werden.

Data-to-Text beschreibt die automatisierte Erstellung natürlichsprachlicher Inhalte auf der Grundlage von Daten. 

Im Prinzip können sie das nächste Wort vorhersagen und damit gut klingende, grammatisch richtige Texte erzeugen. 

Verwenden Logiken und Trigger, um Aussagen aus Daten abzuleiten und daraus inhaltlich und grammatisch richtige Texte zu erzeugen. 

Texte werden sequentiell erzeugt (ein Text nach dem anderen wird ausgegeben) und müssen ausgewählt, einzeln geprüft und überarbeitet werden. 

Das zentrale Regelwerk wird konfiguriert und kontrolliert, die ausgegebenen Texte brauchen keine Prüfung mehr. 

SEO-Expertin Miranda Miller vom Search Engine Journal, weist zurecht darauf hin, dass es sehr viele etablierte AI Content-Projekte gibt, die sehr guten Content haben (und auch immer noch damit gut bei Google ranken): “Die Associated Press hat 2014 damit begonnen, AI für die Generierung von Nachrichten einzusetzen. Der Einsatz von AI bei der Erstellung von Inhalten ist nicht neu, und der wichtigste Faktor dabei ist ihre intelligente Anwendung”.

Welche automatisierten Inhalte sind für Google verdächtig?

Quelle: Google Webmaster Richtlinien Automatisierte Texte

 

  • sinnfreier Text, in dem Schlüsselwörter verteilt sind
  • automatisiert übersetzte Texte ohne Prüfung oder zugrundeliegendes Regelwerk
  • extrem einfacher automatisierter Text auf Basis von Markov-Ketten oder mit Techniken der Synonymisierung oder Verschleierung
  • Inhalte, die aus verschiedenen Webseiten zusammengefügt werden ohne ausreichenden Mehrwert

Warum Data-to-Text Content weiterhin für SEO verlässlich ist:

 

  • Der Inhalt des Contents beruht auf Daten und Dateninterpretationen und basiert nicht auf bedeutungslosen Verallgemeinerungen. 
  • Die Bedeutung der Inhalte – und damit auch der Nutzerwert für Google – wird von den AX Usern (via Logiken, Stories und Triggern) festgelegt. Es gibt also Semantik in den Texten, nicht nur richtige Syntax.
  • Jede Entscheidung der AI-Komponenten im System wird vom User überprüft.  
  • In allen entscheidenden Phasen des Generierungssystems werden User einbezogen.
  • Es gibt Software, die feststellen kann, ob ein Text auf großen Sprachmodellen beruht, aber keine technische Möglichkeit Data-to-Text Content zu identifizieren. 
AX_Website_Home_Header

Ist Textautomatisierung das Richtige für dein Unternehmen?

Jetzt im kostenlosen Beratungsgespräch herausfinden!

Step 1: Übermittle deine Kontaktinformationen.
Step 2: Wähle deinen gewünschten Termin.