Neue IT-Berufe Wie man als Datenschürfer Karriere macht

In den Datenbergen, die auf Servern lagern, sind Unmengen Informationen und Erkenntnisse versteckt. Data Scientists sollen diese Schätze heben.

Von Juliane von Wedemeyer

Kaum stehen wir morgens auf, produzieren wir die ersten Daten. Niemand muss dazu seinen Computer anschalten. Es genügt, das Licht anzuknipsen oder die Dusche aufzudrehen. Die Daten über Wasser- und Stromverbrauch landen früher oder später beim jeweiligen Versorgungsunternehmen. Dank der Digitalisierung des Alltags wird die Menge der Daten von Jahr zu Jahr größer. Einer Reihe von Studien zufolge erzeugen die Menschen um die 1,8 Trilliarden Bytes Daten im Web - jeden Tag. Sie surfen im Internet und nutzen Geräte und Maschinen, die damit vernetzt sind. Nur zur Verdeutlichung: Eine Trilliarde ist eine Eins mit 21 Nullen. Prognosen zufolge wird sich diese Zahl alle zwei Jahre verdoppeln.

Dabei sind etwa 90 Prozent aller Daten unstrukturiert. Das heißt: Es sind Tweets, Fotos, Einkaufshistorien von Kunden oder sogenannte Logfiles in Computern, Webservern oder Mobiltelefonen. Nutzen tun sie so erst einmal niemandem. Dafür müssen sie aufbereitet und in Datenbanken gespeichert, geordnet, analysiert und ausgewertet werden. Im Umfeld von Big Data - so der Begriff, der sich für die Datenmengen durchgesetzt hat - sind darum mehrere neue Berufsbilder entstanden: Neben dem Data Engineer, der weiß, wo die Daten gespeichert sind und wie er sie in eine auswertbare Infrastruktur integriert, der Data Steward, der für die Überwachung und die fachliche Korrektheit der Daten zuständig ist. Und eben der Data Scientist.

Wie der Computer zur Hochsicherheitszone wird

Wirklich sicher gegen Angreifer sind nur spezielle Betriebssysteme wie Tails und Subgraph. Sie haben aber einen Haken. Von Jessica Binsch mehr ...

Thorsten Burdeska ist solch ein Data Scientist. Der 40-Jährige arbeitet bei Accenture, einem der größten Technologie-Dienstleister weltweit. Er und seine Kollegen sind diejenigen, die Antworten aus Daten generieren. Im besten Fall ziehen sie daraus geniale Erkenntnisse und können sie dann auch noch so anschaulich visualisieren und erklären, dass sie auch die IT- und Statistik-ferneren Abteilungen verstehen. "Meine Arbeit ist sehr vielfältig", erklärt Burdeska. "Bei jeder Herausforderung lerne ich etwas dazu - neues Detailwissen über Produktionsprozesse oder Ökosysteme. Das sorgt auch immer für guten Gesprächsstoff."

Mit geschicktem Datenabgleich lässt sich effizienter produzieren

Längst ist Big Data nicht mehr nur ein Thema für die IT-Branche. Es betrifft alle Wirtschaftszweige und nicht nur diese. Die Vereinten Nationen etwa können inzwischen drohende Virusinfektionen oder Unruhen früher erkennen, sofern sie die Muster, welche die Millionen öffentlicher Kurznachrichten, Fotos, Videos und anderer Daten erzeugen, richtig deuten.

Thorsten Burdeska hilft vor allem Industrie-Unternehmen, effizienter zu produzieren. "Ich habe sozusagen Industrie 4.0 miterfunden", erzählt er am Telefon. Er meint die Digitalisierung und Analyse von Maschinendaten. Begonnen hatte das bei einem Bier in einer Kneipe. Ein befreundeter Ingenieur erzählte ihm von einer Aluminium-Guss-Maschine, die immer wieder fehlerhaft arbeitete und keiner wusste warum. So kam Burdeska auf die Idee, die Maschinen- und Produktionsdaten mit weiteren Daten wie der Raumtemperatur, dem Wetter und vielen weiteren zu vergleichen. Und er fand den Fehler: Jedes Mal, wenn ein starker Wind wehte, änderten sich die Temperatur und der Luftdruck in der Produktionshalle. Leichtmetall reagiert sensibel auf Temperaturschwankungen. Schon 1,2 Grad Unterschied wirken sich auf die Produktion aus. Als das Unternehmen die windzugewandte Hallenseite abdichten ließ, war das Problem behoben.