Aktuelles Lexikon:Web-Scraping

Übliche Methode, um Daten automatisiert aus dem Netz abzurufen - auch genutzt von Kriminellen.

Von Benedict Witzenberger

Preisvergleichsportale, Flugsuchmaschinen und auch Analysen von Corona-Daten: Sie alle nutzen Computerprogramme, um Informationen im Internet zu sammeln. Oft sind die Daten auf unzähligen Webseiten verteilt, wer sie händisch sammeln müsste, wäre lange beschäftigt. Wenn die Seiten aber ähnlich aufgebaut sind, können sie von kleinen Computerskripten in kurzer Zeit abgefragt werden. Im Fachjargon nennt sich das "Web-Scraping", vom englischen Verb "to scrape" - etwa: abkratzen, oder schaben. Diese "Scraper" kratzen die Daten aus der Webseitenstruktur heraus, damit man sie analysieren und weiterverarbeiten kann. Datenjournalisten nutzen diese Techniken zum Beispiel, um politische, wirtschaftliche oder soziale Phänomene mit Daten messbar zu machen. Laut Facebook ist diese Methode aktuell dafür verantwortlich, dass die Handynummern von mehr als 530 Millionen Nutzern im Internet stehen. Angreifer schickten Unmengen automatisch erzeugter Nummern an die Plattform und erhielten Infos zurück, zu welchen Nutzern sie gehörten. Dass sich diese Funktion bis September 2019 überhaupt ausbeuten ließ, liegt auch in Facebooks Verantwortung - obwohl die Plattform betont, dass die Angreifer gegen die Nutzungsbedingungen verstoßen hätten.

Zur SZ-Startseite

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: