bedeckt München 17°
vgwortpixel

Deutsche Sprache:"Selten verschwindet ein Wort ganz"

(Foto: Illustration Jessy Asmus)

Die Zeiten des gedruckten Wörterbuchs sind vorbei. Wolfgang Klein über die Vorteile des digitalen Lexikons, vergessene Wörter und das Problem der Jugendsprache.

Das "Zentrum für digitale Lexikographie der deutschen Sprache" (ZDL) soll das größte Wörterbuch der deutschen Sprache erarbeiten. Ein umfassendes digitales System, das dem Leser interaktive Nutzung und Recherche ermöglicht. Wolfgang Klein ist Sprachwissenschaftler und leitet das neue ZDL in Berlin, wie zuvor bereits dessen Vorgängerprojekt "Digitales Wörterbuch der deutschen Sprache" (DWDS). Im Gespräch erklärt er, wie man neue Wörter findet und warum es manche nie ins Lexikon schaffen.

SZ: Herr Klein, wie viele Wörter benutzt man eigentlich?

Wolfgang Klein: Die deutsche Gegenwartssprache hat ungefähr fünf Millionen Wörter. Die sind auch wirklich in Gebrauch, wie uns Daten aus der Zeit zwischen 1995 und 2005 zeigen. Ein einzelner Sprecher verwendet zwar nur einen aktiven Wortschatz von mehreren tausend Wörtern, aber er versteht natürlich ungleich mehr.

Und diese fünf Millionen Wörter listet das Zentrum für digitale Lexikographie auf?

Das Ziel ist, den gesamten deutschen Wortschatz sehr sorgfältig zu beschreiben - in allen möglichen Aspekten. Die Methoden sind ganz anders als beim klassischen gedruckten Wörterbuch, es ist vielmehr ein digitales, lexikalisches System. Wir planen zunächst 200 000 Vollartikel - zum Teil greifen wir auf ältere Quellen im DWDS zurück, die wir nun überarbeiten.

Wodurch unterscheidet sich Ihr System vom Duden, der auch online zugänglich ist?

Es kann viel mehr Wörter erfassen und hat mehr Funktionen. Klickbare Statistiken zeigen zum Beispiel in Verlaufskurven, wann ein Wort aufgetaucht ist. Aber vor allem kann der Nutzer direkt in eine Textquelle hineinspringen und selbst nachlesen.

Und wie finden Sie die Wörter?

Wir arbeiten mit verschiedenen digitalisierten, thematisch gebündelten Textsammlungen - sogenannte Korpora. Für den historischen Bereich haben wir eine Auswahl von etwa insgesamt 3000 Texten, die zeitlich zwischen 1600 und 2000 gestreut sind. In diesem Korpus ist der Faust drin oder die Kritik der reinen Vernunft, aber auch Kochbücher, psychologische Werke und Zeitungen. Für den gegenwartsbezogenen Teil arbeiten wir mit vielen verschiedenen Korpora, hauptsächlich aber mit Zeitungen. Manche können wir im Volltext dem Leser zugänglich machen. Die sozialen Medien nutzen wir auch, es gibt Blog- und Chatkorpora. Das ist technisch zwar kein Problem, rechtlich aber schwierig - eine Grauzone. Wir haben einen Mitarbeiter, der nur Webcrawling macht, also nach Sachen sucht, die heruntergeladen werden dürfen.

Wie schnell können Sie aktuelle Veränderungen in der Sprache abbilden?

Unsere Textsammlungen hinken immer ein wenig hinterher, etwa ein halbes Jahr. Das hat den wichtigen Grund, dass Zeitungen manchmal Korrekturen machen, die wir berücksichtigen müssen.

Sprachwissenschaftler Wolfgang Klein, Leiter des ZDL Berlin

Wolfgang Klein leitet das "Zentrum für digitale Lexikographie der deutschen Sprache" in Berlin.

(Foto: WK; BBAW)

Sie arbeiten sich wohl kaum von A nach Z durch, wie ein gedrucktes Wörterbuch?

Nein, man macht das eher nach Wichtigkeit der Wörter. Die wird von der Häufigkeit eines Wortes bestimmt, davon ob es in verschiedenen Textsorten vorkommt und ob es einfach ist - einfache Wörter die sind wichtiger als zusammengesetzte. Auch die Beschreibungstiefe variiert nach einem gestuften System. Teilweise muss man nur wenige Angaben machen, grammatische können automatisiert werden.

Was ist für Sie denn ein ganz einfaches Wort?

Eigentlich wäre "Maus" ein gutes Beispiel. Das ist so ein kleines, graues Lebewesen. Aber seit ungefähr 30 Jahren hat es noch eine andere Bedeutung bekommen, die man beschreiben muss, nämlich die Computermaus.