Zurück zum Blog

Textautomation braucht strukturierte Daten

Lesezeit 3 mins | 08.05.2020 | Von: Robert Weißgraeber

Im Interview erläutert Dr. Horst Wigger, Geschäftsführer und Mitgesellschafter der text2net GmbH, das Geschäftsmodell Content-Management und die Bedeutung der Datenstrukturierung für digitale Prozesse wie Textautomation.

Warum betont text2net Content-Management und nicht Content-Marketing?

Es gibt viele gute Content- und Online-Marketing-Agenturen auf dem Markt, da hätte es text2net nicht gebraucht. Ich selber habe ja viele Jahre im Online Marketing bei Pixelpark gearbeitet. 

Was es aber bei der Gründung von text2net 2004 nicht gab und bis heute kaum gibt, das sind Spezialisten für das operative Content-Management. Seitdem Content-Management-Systeme auf dem Markt sind, können Unternehmen zwar in der Theorie ihre Inhalte „eigentlich“ selber schnell und unkompliziert online publizieren. Doch in der Praxis sind das vor allem in der internationalen Kommunikation viele, teilweise sehr komplexe Prozesse. Selbst für Fachredaktionen großer Unternehmen sind das große Herausforderungen. Erst recht, wenn die Arbeit tief im CMS nicht zum Tagesgeschäft gehört.

Wir dagegen arbeiten täglich mit marktführenden CMS-Lösungen im internationalen Marketingumfeld. Darum können wir unsere Kunden sowohl bei der täglichen Content-Pflege, als auch bei weltweiten Kampagnen, Migrations- und Rollout-Projekten schnell und effizient unterstützen. Dadurch sind wir nicht nur beim Handling von Content hochspezialisiert, sondern auch bei allen Projektprozessen rund um das Content-Management. Da stecken wir einfach tiefer drin als die Content-Marketing-Agenturen.

Wie passt Textautomation in das Portfolio?

Auch Produktinformationen für PIM-Systeme, Stammdaten für CRM-Anwendungen oder Asset-Tags in DAM-Lösungen sind ja Content, der in Editoren-Systemen irgendwie „gemanaged“ werden muss. 

In all diesen Fällen können wir beim Content-Management die ideale Schnittstelle zwischen Lösungsanbietern und Kunden sein. Und dazu gehört inzwischen eben auch das Aufbereiten von Content, aus dem mit NLP-Lösungen wie AX Semantics automatisierte Texte erstellt werden.

Warum auch noch Datenstrukturierung?

Strukturierte Daten sind eine entscheidende Bedingung z.B. für die Erstellung automatisierter Produkttexte im E-Commerce. Doch gerade im Mittelstand liegen viele Inhalte noch gar nicht ausreichend strukturiert in digitaler Form vor. Man mag es kaum glauben, aber das gilt sogar häufig für die eigenen Produkte. Hier sind wichtige Produktdaten oft noch in PDF-Dokumenten „vergraben“. An automatisierte Produkttexte ist da noch nicht zu denken. Diese Erfahrung habt ihr als AX Semantics sicher auch schon gemacht.

Da traf es sich gut, dass sich unsere Muttergesellschaft Charax GmbH bereits seit Jahren mit semantischen Algorithmen beschäftigt. Nicht zuletzt durch den Bedarf für die Textautomation hat Charax noch mal investiert und einen PDF-Analyzer entwickelt. Dieses Tool liest PDF-Dokumente automatisiert aus und bringt den Content in eine semantisch strukturierte Form. Damit ist ein wichtiger Schritt gemacht, um mit der Textautomation starten zu können!

Was ist besonders an eurem PDF-Analyzer?

Unser PDF-Analyzer arbeitet in drei Phasen:

Die semantische Analyse erkennt nicht nur bestimmte Begriff in einem PDF. Sie prüft darüber hinaus durch Grammatiken, in welchem Kontext ein Begriff steht. Damit wird nahezu sichergestellt, dass ein bestimmter Begriff auch wirklich die erkannte Bedeutung hat, z.B. Produktgewicht, Kleidungsfarbe, Speicherkapazität. Die so strukturierten Daten können als JSON ausgegeben und über eine REST-API auf einem Webportal zur Weiterverarbeitung abgerufen werden.

Bei der Analyse wird der Inhalt übrigens zusätzlich nach schema.org strukturiert. So kann die semantische Datenstrukturierung nicht nur die Auffindbarkeit in Suchmaschinen erhöhen, sondern auch die Darstellung der Inhalte auf Trefferseiten verbessern.

Wo geht die Reise für euch hin?

Bisher ging es fast ausschließlich um das Content-Management von klassischen Marketinginhalten in CMS für Websites. Dieses Betätigungsfeld hat sich langsam erweitert auf weitere Plattformen wie DAM-, NLP- und PIM-Lösungen. Dabei sind für uns Partnerschaften mit Lösungsanbietern wie AX Semantics sehr wichtig. Denn nur so können wir gemeinsam für Kunden zu besten Ergebnissen kommen.

Inzwischen können wir die Content-Wertschöpfungskette von der Datenstrukturierung über das Content-Editing bis zur Textautomation und Content-Anreicherung mit unseren Dienstleistungen unterstützen. Wir nennen das: Smart Content Automation Services (SCAS).

Dieses Portfolio ist weiterhin auf Content-Management-Dienstleistungen fokussiert. Und diese Spezialisierung soll auch bleiben!

Hintergrundinformationen über die AX Semantics Software zur Textautomatisierung:

Mit der intuitiven AX Semantics Software sind Unternehmen schnell in der Lage, alle benötigten Inhalte zu generieren und so mit den täglichen Geschäftsanforderungen Schritt zu halten. Die AX-Software ist 100 % SaaS – alles ist vom Schreibtisch aus über den Webbrowser verfügbar, es sind keine Programmier- oder IT-Abteilungen erforderlich. Mit unserem Self-Service inklusive integriertem E-Learning können Kunden innerhalb von 48 Stunden mit der automatisierten Generierung von Texten beginnen – mehr als 500 Kunden haben dies bereits erfolgreich getan. Wir arbeiten mit einigen der weltweit bekanntesten Marken zusammen, darunter Porsche, Deloitte, Mytheresa und Nivea.

Robert Weißgraeber

Robert Weissgraeber ist Co-CEO und Co-Gründer von AX Semantics, wo er u.a. sich mit Produktentwicklung beschäftigt als Managing Director tätig ist. Robert Weißgraeber ist ein gefragter Redner und Autor zu Themen wie agile Softwareentwicklung und Natural Language Generation (NLG) Technologien und Mitglied des Forbes Technology Council. Zuvor war er Chief Product Officer bei aexea und studierte Chemie an der Johannes Gutenberg-Universität und forschte an der Cornell University.