Methodik zur Datenrecherche #hassmessen:So haben wir den Hass gemessen

teaser hassmessen

Millionen Telegram-Nachrichten wurden datenanalytisch untersucht.

(Foto: SZ)

In einer mehrmonatigen Datenrecherche hat die SZ fast zwölf Millionen Nachrichten im Messengerdienst Telegram ausgewertet.

Von Berit Kruse und Martina Schories

Hass ist nicht einfach so messbar. Er hat keine Basisgröße, keine Einheit - mehr noch: Es sind sich nicht mal alle darüber einig, wie er aussieht oder klingt. Für die aktuelle Datenanalyse #hassmessen, für die während der Corona-Pandemie fast 1000 radikale Telegram-Gruppen und -Kanäle untersucht wurden, hat die SZ trotzdem eine Methode gefunden, mit der sich über eine Datenrecherche nachvollziehen lässt, wie sich Menschen im vergangenen Jahr radikalisiert haben.

Nach umfassender Recherche gehen wir davon aus, dass Radikalisierung sich - zumindest in vielerlei Hinsicht - über Sprache ablesen und erfassen lässt. Denn: Sprache kann Situationen abbilden, interpretieren, umdeuten. Dass Kritiker der Corona-Maßnahmen sich auf NS-Vokabeln wie das "Ermächtigungsgesetz" berufen, ist ebenso wenig Zufall, wie dass Neue Rechte Migrationsbewegungen mit Naturkatastrophen gleichsetzen und so Begriffe wie "Asylflut" neu schaffen. Einzelne Wörter können rhetorische Strategien offenlegen, so wird mit Begriffen wie "Schuldkult" oder "Toleranzfaschismus" eine gezielte Inszenierung als Opfer von politischen Situationen deutlich. Mit Codes, die Experten Hundepfeifen-Politik nennen, können radikale Akteure unbemerkt an Gleichgesinnte appellieren, ohne dass es von der breiten Öffentlichkeit bemerkt wird.

Deswegen haben wir für die Datenanalyse fast zwölf Millionen Chat-Nachrichten systematisch ausgewertet und in ihnen Wörter gezählt - solche, die auf die eine oder andere Art und Weise Aggressivität, Hetze, Verschwörungserzählungen und letztlich Hass transportieren -, also die Wortgewalt, die letztendlich Radikalisierung bedingt und beschreibt.

Datenrecherche #hassmessen

Dieser Artikel ist Teil des Projekts #hassmessen. Die digitale Reportage zur Recherche und weitere Beiträge aus dem Themenschwerpunkt finden Sie hier: sz.de/hassmessen.

Welche Wörter haben wir gezählt?

Weil es noch kein universelles Wörterbuch gibt, mit dem Radikalität oder gar Hass gemessen werden kann, haben wir eines erstellt. Wir haben viele Listen zusammengetragen und Bücher gelesen, das "Wörterbuch des besorgten Bürgers" beispielsweise, dessen Autor Robert Feustel bei ersten Vorbereitungen beraten hat. So haben wir eine umfangreiche Sammlung von Signalwörtern erstellt, die im Laufe der Recherche sukzessive erweitert wurde. Teilweise haben wir dafür auf automatisierte Methoden zurückgegriffen, um in Telegram-Nachrichten nach Begriffen zu suchen, die in ähnlichen Kontexten vorkommen wie bereits erfasste Begriffe.

Am Ende der Recherche hat das zugrundeliegende Wörterbuch 2500 Einträge. Um die Recherche zu strukturieren, verteilen wir diese Begriffe auf Kategorien: In der Analyse werten wir die Kategorien Extremismus, Demagogie, Beleidigung und nicht-antisemitische Verschwörungserzählungen aus.

Beleidigungen beziehen sich oft auf Personen des öffentlichen Lebens und verballhornen deren Namen: "Södolf" zum Beispiel für den bayerischen Ministerpräsidenten, "Drostnochio" für den Virologen Christian Drosten, oder "Spahnferkel" für Minister Jens Spahn. Aber auch bestimmte gruppenbezogene Beleidigungen fallen in diese Kategorie, "Drecksmedien" zum Beispiel.

In der Kategorie nicht-antisemitische Verschwörungserzählungen sammeln wir Begriffe, die signalisieren, dass User alternative, nicht nachgewiesene Erklärungen für Zustände reproduzieren, die zwar auf eine vermeintliche Verschwörung hinweisen, aber nicht im Kern judenfeindlich sind. Dazu gehört der Hashtag "flacheerde", der die Erzählung referenziert, die Erde sei nicht rund, oder Begriffe wie "Klima-Irrsinn", die den menschengemachten Klimawandel leugnen.

Antisemitische Verschwörungserzählungen, die zum Beispiel durch Verweise auf die Protokolle von Zion referenziert werden, sammeln wir dagegen unter Extremismus. In dieser Kategorie befinden sich außerdem islamfeindliche Begriffe, rassistische Beleidigungen, völkisches und NS-Vokabular sowie Codes der Reichsbürgerszene, also Begriffe wie "Asylindustrie", "Bevölkerungsaustausch" oder "Finanzjudentum" - und schlimmere, explizite Begriffe, die wir hier nicht zitieren und damit reproduzieren möchten.

Die Kategorie "Demagogie" umfasst Begriffe, die zwar nicht inhärent extremistisch anmuten, wohl aber eine hetzerische, aufwieglerische Qualität haben. "Altparteien" zum Beispiel, oder "Corona-Diktatur".

Bei der Auswahl der Kategorien haben wir uns unter anderem an der Theorie der gruppenbezogenen Menschenfeindlichkeit orientiert: einer Theorie, die abwertende Einstellungen gegenüber anderen Menschen aufgrund der Zugehörigkeit zu einer bestimmten Gruppe behandelt. Diese Theorie ist ungleich komplexer als unsere Wörterbuch-Übersetzung, sie untersucht Zusammenhänge und Entwicklungen dieser Einstellungen und beinhaltet weitere radikale Dimensionen. Damit wir unsere Analyse quantitativ durchführen konnten, mussten wir uns auf Kategorien konzentrieren, für die es eindeutige Signalbegriffe gibt.

Wie funktioniert die Vergabe von Hasspunkten?

Nach den Begriffen aus dem Wörterbuch suchen wir in den gespeicherten Nachrichten. Für einen Treffer gibt es einen Punkt. Bei zahlreichen Nachrichten gibt eine Vielzahl von Treffern. Die Nachricht mit den meisten Punkten wurde Ende März verschickt, sie kommt auf 145 Punkte: In ihr wird Attila Hildmann in eindeutig abwertender Art und Weise als Jude bezeichnet, in Großbuchstaben und 145-facher Wiederholung.

Hohe Punktzahlen sind auch möglich, weil manche Wörter in mehreren Kategorien Punkte erhalten. So zum Beispiel das Wort "Abschaum": Weil es eine rassistisch konnotierte Beleidigung ist, findet es sich bei "Beleidigung" und auch bei "Extremismus".

Besonders schwierig war der Umgang mit mehrdeutigen Begriffen, die in verschiedenen Kontexten eine ganz andere Konnotation haben, in bestimmten Gruppen aber als Code benutzt werden: Viele Wörter, die in den Telegram-Gruppen oder -Kanälen verwendet werden, haben außerhalb dieses Kontextes andere Bedeutungen. So zum Beispiel "5G-Antennen": Die Erzählung, dass von eben diesen eine gesundheitliche Belastung ausgeht, vielleicht sogar das Coronavirus verbreitet wird, ist in Corona- oder Verschwörer-Gruppen und -Kanälen gängig und gilt dort als Signalwort für Verschwörungserzählungen. Im gesamtgesellschaftlichen Diskurs wird der Begriff aber völlig wertneutral verwendet.

Wir wollten den Hass nicht überschätzen, zumal es natürlich auch denkbar ist, dass auf Telegram Diskussionen über Mobilfunkstandards geführt werden. Begriffe dieser Art, die uneindeutig sind, zählen wir deswegen nur, wenn sie in Zusammenhang mit eindeutigen Begriffen auftauchen. Haben wir also einen Treffer für "5G-Antennen" alleine, bekommt dieser keinen Punkt. Taucht der Begriff in Zusammenhang mit einer vermeintlichen "Plandemie" auf, können wir davon ausgehen, dass die dazugehörige nicht-antisemitische Verschwörungserzählung gemeint ist. Alle Begriffe des Wörterbuchs wurden mehrfach von verschiedenen SZ-Mitarbeiterinnen und -Mitarbeitern überprüft und diskutiert, um sicherzustellen, dass sie in der passenden Kategorie hinterlegt sind.

Auf welcher Datengrundlage haben wir recherchiert?

Am Anfang der Recherche stand außerdem die Entscheidung, auf welcher Datenbasis wir Analysen durchführen können. Wie bei der vorausgegangenen Recherche "Die digitale Infektion" wollten wir den Messenger Telegram untersuchen, weil sich hier zahlreiche Protestbewegungen organisieren und weil wir bereits wussten, wie stark hier rechtsextreme Akteure mit Verschwörungsideologen vernetzt sind und wie sich Menschen hier radikalisieren können.

Bei der Auswahl der Gruppen und Kanäle konnten wir auf das vorangegangene Projekt aufbauen. Um die Daten diesmal selbst zu erheben, sind wir mit zwei fingierten Telegram-Accounts so vielen Gruppen und Kanälen wie möglich beigetreten. Über den Herbst und Winter entstanden eine ganze Reihe weiterer Gruppen und Netzwerke, besonders solche, die sich thematisch mit der Pandemie befassen. Diese haben wir ebenfalls in unsere Liste aufgenommen. Insgesamt sind wir fast 1000 Gruppen und Kanälen beigetreten.

Wie haben wir die Gruppen und Kanäle sortiert?

Um unsere Recherche zu strukturieren, haben wir auch die Gruppen und Kanäle in vier unterschiedliche Kategorien eingeteilt: Gruppen, die nur entstanden sind, weil es die Pandemie gibt, nennen wir "Corona-Gruppen". Dazu zählen die bekannten Corona-Rebellen und Querdenker, aber auch alle neueren Initiativen wie "Ärzte für Aufklärung" oder "Studenten stehen auf".

In die Kategorie "Verschwörung" fallen solche Gruppen, in denen Propaganda über die angeblichen Gesundheitsgefahren durch 5G verbreitet wird, oder Kanäle, die davon überzeugt sind, dass die Regierung über Flugzeuge Gift versprühen lässt. Weitere Indikatoren für Gruppen dieser Art sind etwa Behauptungen, dass über eine Corona-Schutzimpfung ein Chip "implantiert" werde oder dass es in Deutschland keine freie Meinungsäußerung mehr gäbe.

Schwierig ist die Abgrenzung dieser Szene zur QAnon-Bewegung, die auf einer umfangreichen Kombination aus verschiedensten Verschwörungserzählungen basiert. Durch die Aggressivität dieser Erzählungen, die umfangreiche Verbreitung und die klar antisemitischen Narrative heben sich diese Art von Gruppen und Kanälen unserer Einschätzung nach jedoch ab von solchen, die wir unter "Verschwörung" zusammenfassen. Deswegen haben sie eine eigene Kategorie bekommen.

Auch die Abgrenzung zwischen QAnon und rechtsextremen Gruppen und Kanälen ist nicht einfach. Der Kitt zwischen beiden ist der Antisemitismus und der Glaube an eine Elite, die die Welt im Geheimen regiert. Es gibt Personen mit eindeutiger, offenkundiger, rechtsextremer Ideologie, die wir bei den Rechtsextremen einsortiert haben, so zum Beispiel Sven Liebich oder Björn Höcke sowie bekannte Organisationen wie die Identitäre Bewegung. Zu den Rechtsextremen zählen auch alle Gruppierungen aus der Reichsbürgerszene, die beispielsweise das Grundgesetz und die Bundesrepublik nicht als Staat anerkennen.

Immer dann, wenn die Zuordnung schwierig war, weil die Nachrichten eines Kanals oder einer Gruppe beispielsweise nicht eindeutig waren, haben wir qualitativ direkt dort, zu den Administratoren oder zu Zitaten in den Kanalbeschreibungen recherchiert. Manchmal waren auch kleinteilige Informationen hilfreich, die Experten auf Twitter oder Blogs festgehalten hatten, um festzustellen, dass hinter einem vermeintlich verschwörungsideologischen Kanal ein rechtsextremer Autor steht.

Was finden wir nicht?

Quantitative Datenanalysen haben bei aller Big-Data-Macht ihre Schwächen. Dazu gehört, dass wir "falsch-positive" Ergebnisse finden: Mitunter wird nicht erkannt, wenn Begriffe ironisch verwendet werden. Wir wissen auch nicht, ob einige Begriffe von Usern nur in Zitaten verwendet wurden. Das ist ein Problem - um den Hass nicht zu unterschätzen, waren wir deswegen bei der Aufnahme von Begriffen in unser Wörterbuch konservativ: Wir haben immer wieder geprüft, welche Ergebnisse wir in den Kategorien finden, indem wir Hunderte Beispielnachrichten mit entsprechenden Hasspunkten gelesen und auf Plausibilität hin abgeklopft haben. Wenn falsche Zuordnungen aufkamen, haben wir nachjustiert und gegebenenfalls Begriffe gelöscht oder anderen Kategorien zugewiesen.

Umgekehrt gilt deshalb aber auch: Alles, was wir messen, müssen wir mit einem mindestens versehen. Der Hass auf Telegram entfaltet sich über mehr als nur einzelne Begriffe - er ergibt sich oft aus dem Kontext. Wenn jemand Politikerinnen beleidigt, dann finden wir diese Nachricht wahrscheinlich. Wenn andere Menschen darauf reagieren, Daumen-hoch-Emojis senden, schreiben "ja - das finde ich auch", dann wird diesen bestätigenden, ebenfalls Hass unterstützenden Nachrichten mangels Signalwörtern keinen Hasspunkt zugeordnet.

Wörter zu zählen heißt auch, dass wir keine Bilder erfassen, keine Memes, keine Sprachnachrichten, keine Videos. Gerade hierüber wird aber auf Telegram viel Hass transportiert. Trotzdem finden wir in insgesamt fast jeder fünften Nachricht radikale Begriffe - und das bedeutet: Selbst die Diagnose, dass knapp ein Fünftel der Nachrichten auf Telegram radikal ist, ist vermutlich - leider - eine Untertreibung.

Wie haben wir die Ergebnisse der Datenrecherche eingeordnet?

Für unsere Analyse haben wir die Entwicklung der Hasspunkte einerseits visuell dargestellt, andererseits mit Trendanalysen den Zusammenhang zwischen zeitlicher Entwicklung und Anstieg der Punkte geprüft. Relative Frequenzanalysen geben Auskunft darüber, welche Begriffe besonders kennzeichnend für eine Gruppe von Texten sind. Die Darstellung der überdurchschnittlich häufig verwendeten Begriffe für jede analysierte zeitliche Phase in Wortwolken erlaubt uns, die Diskursverschiebung in der Corona-Szene auf Wortebene zu veranschaulichen.

Die Resultate der Datenanalyse haben wir immer wieder überprüft und im Datenteam selbst sowie mit Kolleginnen aus dem Fachressort Politik diskutiert. Wir haben darüber hinaus mit Experten von Robert Feustel über die Soziologen Swen Hutter von der Freien Universität Berlin und Wilhelm Heitmeyer von der Universität Bielefeld bis hin zur Politikberaterin Julia Ebner Rücksprache zu unseren Schlussfolgerungen gehalten und deren Einschätzungen zu den Entwicklungen allgemein eingeholt. Erkenntnisse aus der Datenrecherche haben wir in unserem Bericht mit Entwicklungen in der analogen Welt kontextualisiert, um so Parallelen aufzeigen zu können.

Zur SZ-Startseite
Wahlfilter Landingpage Teaser

Politik in sozialen Netzwerken
:Wie verzerrt ist Instagram?

Wir wollen herausfinden, wie auf Instagram Politik gemacht wird - und gemeinsam dem Algorithmus auf die Spur kommen. Bei der Datenrecherche im Projekt #wahlfilter, die die SZ gemeinsam mit Algorithm Watch gestartet hat, beginnt nun die Auswertung.

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: