SZ-Werkstatt Auf Trab

Wie wertet man eigentlich so riesige Datenmengen wie bei den Panama Papers aus? Das erklärt Vanessa Wormer, Datenjournalistin im SZ-Ressort Investigative Recherche und der Entwicklungsredaktion.

Wie wertet man eigentlich so riesige Datenmengen wie bei den Panama Papers aus?

Das erklärt Vanessa Wormer: "Das Ressort Investigative Recherche hat die hausinterne IT-Abteilung in den vergangenen Monaten ziemlich auf Trab gehalten: Als sich vor gut einem Jahr eine anonyme Quelle bei der Süddeutschen Zeitung meldete und seitdem immer mehr Daten der Panama Papers hier ankamen, wuchsen auch die technischen Anforderungen. Anfangs gingen wir noch davon aus, mit einem einzigen neuen Laptop die Datenmenge bewältigen zu können. Von wegen! Bald war klar: Ein Laptop wird nicht ausreichen. Also forderte das Ressort einen Hochleistungsrechner an. Und nur wenige Wochen später einen weiteren. Die neue Workstation mit 128 Gigabyte Arbeitsspeicher und ausgestattet mit mehreren Terabyte großen SSD-Festplatten brachte uns einen großen Schritt voran bei der Arbeit an den Panama Papers.

Der datengetriebene Größenwahn wurde nur noch von den Sicherheitsvorkehrungen übertrumpft, die wir uns selbst auferlegten: Keiner der Rechner durfte mit dem Internet verbunden werden, neue Festplatten wurden komplett verschlüsselt. Wir wussten natürlich, dass das alles einen Sinn haben würde. Für nicht eingeweihte Außenstehende dagegen mussten die Maßnahmen übertrieben wirken.

Während der Raum der Investigativen Recherche also über die Monate zu einer kleinen Serverfarm heranwuchs, nahm auch die Geschwindigkeit zu, mit der die Dokumente durchsucht werden konnten. Dennoch gilt: Wer mit so großen Datenmengen hantiert, lernt vor allem eins: Geduld. Die bringen hoffentlich auch die Mitarbeiter der IT wieder auf, wenn wir in Zukunft weiter Festplatten bestellen."