Daten, alle Welt redet von Daten. Sogar höchst analoge Geräte wie Baumaschinen sollen Daten senden - aber wo ist eigentlich der Mehrwert? Wenn ihm einer eine solche Frage stellt, erzählt René Ahlgrim die Geschichte von den Zündkerzen. Ahlgrim arbeitet im IT-Management der Firma Zeppelin aus Garching bei München. Die vertreibt Baumaschinen des US-Herstellers Caterpillar und betreibt im Auftrag von Firmen auch Blockkraftwerke. In diesen laufen Motoren, und die brauchen Zündkerzen.
Zeppelin überwacht alle Anlagen zentral von Hamburg aus
Das allerdings sind Bauteile von begrenzter Lebensdauer. Irgendwann gehen sie kaputt - der Motor bleibt stehen. "Früher", sagt Ahlgrim, "musste ein Techniker da hinfahren, und der wusste nur, der Motor steht". Heute ist das anders. Heute überwacht Zeppelin eine ganze Reihe verschiedener Datenquellen in einem solchen Kraftwerk. Seit vielen Jahren setzt das Unternehmen dafür eine Software namens Splunk ein. Die Software erkennt, wenn etwas nicht normal läuft und schlägt dann Alarm. Der Ausfall einer Zündkerze etwa geschieht meist nicht spontan, sondern kündigt sich einige Zeit vorher an. Erkennbar ist das beispielsweise an der niedrigeren Abgastemperatur des Motors. Dann schickt Zeppelin einen Mechaniker los, der die Zündkerze wechselt, bevor der Motor stehen bleibt. Denn die Firma bekommt für die Zeit, in der ein Motor steht, kein Geld vom Kunden. Zeppelin überwacht daher alle diese Anlagen in ihrem Fleet Operations Center in Hamburg.
Seit etwa zehn Jahren setzt der Baumaschinen-Vertrieb bereits die Datensoftware Splunk ein. Sie biete vor allem einen großen Vorteil, sagt der Informatiker Andreas Zientek von Zeppelin: "Früher hatten wir für jedes System ein eigenes Werkzeug, dazu noch viele einzelne Skripte der Systemverwalter". Ein Horrorszenario für die Wartung. Aber nicht nur die firmeneigenen Systeme sind unterschiedlich, auch die Maschinen unterschiedlicher Hersteller können zwar inzwischen alle Daten senden, nur wie, das ist die Frage. "Ein IT-ler würde niemals solche Logdateien schreiben." Und ein einheitliches Format ist nicht in Sicht. Dem Datenfresser Splunk aber sei das alles egal, sagt Zientek. Alle Systemverwalter hätten jetzt ein neutrales Werkzeug mit gleicher Benutzersprache. Alle neuen Systeme würden darin integriert. Dazu gehören auch die IT-Systeme der Firma. Splunk erfasse auch, wenn es Anomalien im Rechenzentrum gebe und zeichnet jede Datenbewegung auf, die beispielsweise in einer Cloud entsteht.
Das Interessante daran: Die Software speichert alle Rohdaten, nicht etwa strukturierte Datensätze, wie man das von gewöhnlichen Datenbanken kennt, etwa einer Adress-Datenbank. Name, Adresse, Telefonnummer, Berufsbezeichnung - das alles wären Felder in einer klassischen Datenbank. Aber was darin nicht in einem Feld steht, danach kann auch nicht gefragt werden. Der Heuhaufen wurde durchsucht, einige Nadeln herausgepickt, das Heu entsorgt.
Anders bei Splunk: "Wir speichern die Rohdaten", sagt Matthias Maier, der das Produktmarketing bei Splunk leitet. Dabei sei es der Software egal, woher die Daten stammen, verwendet werden könne alles, was Text ist. Die Unternehmen hätten heute zwar eine riesige Menge an Daten, aber: "Es ist schwierig, Daten unterschiedlicher Hersteller oder aus unterschiedlichen Quellen zu bergen, sie zu zentralisieren und etwas davon abzuleiten", sagt Maier.
Daher werden alle Abfragen immer auf die Rohdaten losgelassen. So können auch Fragen beantwortet werden, an die zunächst niemand gedacht habe, und die deshalb womöglich nicht in eine strukturierte Datenbank aufgenommen worden wären. Das Verfahren bietet noch einen Vorteil: Die Arbeit, die Daten für die Speicherung in einer strukturierten Datenbank aufzunehmen, entfällt. Das kann sehr bedeutsam sein: 80 Prozent der Zeit gingen dafür drauf, Daten fit für die Abfrage zu machen, sagt Maier.