Zurück zum Blog

So nutzt du externe Daten erfolgreich

Lesezeit 2 mins | 20.10.2020 | Von: Carina Meyer

Kevin Goßling ist Gründer und Geschäftsführer von Fusionbase. Fusionbase ist der Data Hub für Daten aus externen Quellen. Im Interview spricht Kevin Goßling über externe Daten und wie Fusionbase Unternehmen bei der Nutzung unterstützt.

Wozu brauche ich externe Daten?

Externe Daten kommen in vielen Bereichen zum Einsatz und sind aus Informationsgetriebenen Branchen wie Medien, Versicherung, Finanzen oder Logistik nicht wegzudenken. Es gibt viele Datenquellen zu den unterschiedlichsten Themen. Beispielsweise lassen sich aus externen Daten automatisiert Texte wie Wetterberichte oder Spielberichte erstellen. Man kann aber auch Naturkatastrophen oder bewaffnete Konflikte besser verstehen und vorhersagen, wenn man Zugriff auf vergangene oder aktuelle Ereignisse hat. Die Bandbreite an Anwendungsmöglichkeiten ist entsprechend groß, genauso wie die Datenquellen, die einem zur Verfügung stehen.

Woher bekomme ich externe Daten?

Externe Daten unterscheiden sich in Open Data, Public Data und Commercial Data. Ersteres sind frei verfügbare und frei verwendbare Daten, die häufig von Behörden wie dem statistischen Bundesamt veröffentlicht werden. Public Data sind allgemein frei verfügbare Daten, die aber nicht immer frei verwendbar sind. Das können Daten von Webseiten sein, die öffentlich zugänglich sind und die man maschinell mit Crawlern extrahieren kann. Commercial Data sind Daten von kommerziellen Datenanbietern, die proprietäre Daten aus ihrem Geschäftsmodell generieren und verkaufen. ImmoScout ist ein Beispiel dafür.

Warum ist es für viele Unternehmen so schwierig externe Daten zu verwenden?

Um externe Daten nutzbar zu machen muss man Daten aus sehr vielen verschiedenen Quellen zusammenbringen, die nur schwer automatisch extrahiert werden können. Besonders aufwendig ist es dafür zu sorgen, dass die Daten stets auf dem aktuellen Stand bleiben wenn neue Daten veröffentlicht werden. Ein aktuelles Beispiel: Um die aktuellsten COVID-19 Fallzahlen zu erhalten muss man Daten von mindestens 16 Gesundheitsämtern extrahieren, zusammenführen und aktuell halten. Aufgrund der dynamischen Lage ist es hier besonders wichtig stets aktuelle Daten zu liefern und dafür zu Sorgen, dass die Daten auch weiterhin extrahiert werden, wenn sich die Webseiten der Gesundheitsämter verändern.

Wie hilft Fusionbase Unternehmen dabei externe Daten nutzbar zu machen?

Unsere Technologie erlaubt es uns automatisch neue Datenquellen zu entdecken und diese dann schnell an unseren Data Hub anzubinden. So haben wir mittlerweile über 100.000 Data Streams in unseren Daten-Katalog hinzufügen können. Dabei ist stets jeder Datensatz auf dem aktuellsten Stand und maschinenlesbar. Mit Standardschnittstellen lassen sich die Daten dann ohne großen Aufwand der IT mit Business Intelligence Software oder automatischen Textgeneratoren wie AX Semantics verbinden.

Wie verwenden ihre Kunden Fusionbase?

Viele unserer Kunden aus der Medienbranche verwenden Fusionbase im Bereich Robo- und Datenjournalismus, sowie im Bereich Audience Analytics. Der Münchener Merkur z.B. verwendet unsere COVID-19 Fallzahlen. Regionale Verlage nutzen unsere Daten, um beispielsweise Spielberichte oder Wetterberichte automatisch zu erstellen. Industriekunden wie BMW oder Versicherungskunden verwenden unsere Daten um automatisch Risiko-Berichte zu Themen wie Kriminalität, Korruption, Terrorismus oder Naturkatastrophen zu erstellen.

Was sind die nächsten Schritte für Fusionbase?

Wir werden unseren Daten-Katalog kontinuierlich weiter ausbauen und wollen nächstes Jahr 1 Millionen Datensätze zugreifbar gemacht haben. Außerdem arbeiten wir an spannenden Funktionen zur automatischen Aufbereitung von Daten basierend auf Ansätze des maschinellen Lernens, damit unsere Kunden noch schneller und einfacher mit unseren Daten arbeiten können.

Carina Meyer