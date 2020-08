Von Simon Hurtz

Vor 20 Jahren wurde das menschliche Genom entschlüsselt, doch noch immer rätseln Wissenschaftler, wie viele Gene der Mensch besitzt. Klar ist nur: 27 dieser Gene haben Tausende Fehler in wissenschaftlichen Fachartikeln ausgelöst. Schuld sind Microsoft Excel und die Unfähigkeit vieler Forscherinnen und Forscher, die Tabellenkalkulation richtig zu bedienen.

Statt das Problem mit der Software zu beheben, ändert das Gene Nomenclature Committee der Human Genome Organisation, kurz Hugo, nun die neuen Richtlinien zur Namensgebung. Menschliche Gene dürfen ab sofort umbenannt werden, wenn ihre bisherigen Bezeichnungen "den Umgang und Abruf von Daten beeinflussen", wie das Gremium schreibt. "Zum Beispiel wurden alle Bezeichnungen geändert, die Microsoft Excel automatisch in Datumsangaben umwandle."

Das Problem ist seit 16 Jahren bekannt

Deshalb heißt etwa der Tumorsuppressor "Deleted in esophageal cancer 1", der bislang als DEC1 bekannt war, künftig DELEC1. Wer die alte Bezeichnung in einer Excel-Tabelle einträgt und die Sprache auf Englisch einstellt, sieht den Grund: Aus "DEC1" wird "1-Dec", weil Excel die Eingabe fälschlicherweise als Datum erkennt. Das Gleiche geschieht bei SEPT1 (neu: SEPTIN1), MARCH1 (neu: MARCHF1) und zwei Dutzend weiteren Genen.

Die Fehlerquelle ist seit langem bekannt. 2004 warnte ein Fachartikel: "Excel-Nutzer sollten sich dieses Problems bewusst sein, das selbst sorgfältige gepflegte Datenbanken kontaminiert hat." Vor vier Jahren untersuchten Forscher mehr als 35 000 Excel-Tabellen im Anhang von rund 3600 wissenschaftlichen Veröffentlichungen. Rund ein Fünftel der Fachartikel stützte sich auf Dokumente, in denen Excel Daten aus Namen gemacht und damit die Forschungsergebnisse verzerrt hatte.

Die Geschichte der Genforschung steckt voller Überraschungen: In den 1990er Jahren gaben Wissenschaftler ihren Entdeckungen kreative Namen. Eine Videospielfigur stand Pate für das Protein "Sonic Hedhehog". Das Gen Zbtb7, das Krebs verursachen kann, trug früher das Akronym "Pokemon" - bis das gleichnamige Unternehmen 2005 mit rechtlichen Schritten drohte, weil es seine Marke nicht in Zusammenhang mit einer tödlichen Krankheit lesen wollte. Andere Gene wurden umbenannt, weil ihre Bezeichnung in manchen Sprachen als beleidigend aufgefasst werden könnte. Nun gibt zum ersten Mal eine Software den Namen vor.

Forscherinnen und Forscher sind erleichtert

Wie kann es sein, dass Microsoft die Regeln der Wissenschaft bestimmt, fragen die einen. Wie kann es sein, dass Menschen, die an den komplexesten Problemen der Wissenschaft herumtüfteln, nicht in der Lage sind, eine simple Software zu konfigurieren, fragen die anderen. Die Realität ist komplexer: Tatsächlich gibt es keine Möglichkeit, die automatische Formatierung komplett zu deaktivieren. Bei jedem neuen Datenimport muss man den entsprechenden Zellen händisch das Format "Text" zuweisen.

Für Wissenschaftler, die oft mit riesigen Datensätzen hantieren, wird die Arbeit nun leichter. Unzählige Stunden seien dafür draufgegangen, die Tabellen zu bereinigen, schreibt etwa die Biologin Mudra Hegde, die am renommierten Broad Institute des Bostoner MIT und der Harvard-Universität forscht, auf Twitter. "Endlich!!!"