Neue Suchmaschinen:Antworten, bitte!

Lesezeit: 3 min

Es muss nicht immer Google sein: Forscher arbeiten an Suchmaschinen, die verstehen, was ihre Nutzer finden wollen.

Helmut Martin-Jung

Vom Startup-Unternehmen zweier Studenten bis zum Börsenliebling in wenigen Jahren - würde Google sein Kerngeschäft nicht ziemlich gut erledigen, die Menschheit wäre wohl nicht auf "googeln" als Synonym für das Suchen im Internet gekommen. Auch wenn Kritiker bemängelten, dass niemand wisse, wie Google zu seinen Ergebnissen komme, und dass der Konzern in großem Umfang Daten ansammle, hat die Firma dennoch die führende Position bei Suchanfragen erobert.

Durch diese Dominanz verschaffte sich der Konzern mit pfiffigen Werbemodellen die Vorherrschaft bei Einnahmen aus dort geschalteten Anzeigen. Als die Firma aus Mountain View in Kalifornien aber auch noch anfing, Literatur im großen Maßstab zu digitalisieren, regte sich Widerstand bei Politikern. Bei der Überlieferung des kulturellen Wissens drohe eine Übermacht der US-Amerikaner, warnte zum Beispiel der Präsident der französischen Nationalbibliothek, Jean-Noël Jeanneney. Die Sorge ist berechtigt: Schließlich sind auch Googles bedeutendste Konkurrenten amerikanische Unternehmen.

Grundlagenforschung

Die Aufregung über Googles Literaturprojekt gab den entscheidenden Anstoß dafür, das deutsch-französische Gemeinschaftsprojekt Quaero zu gründen. Während die Franzosen jedoch Google Konkurrenz zu machen versuchten, wollten die Deutschen die bessere Suchmaschine erfinden, die irgendwann lernen sollte zu verstehen, was auf den Internetseiten eigentlich zu finden ist, die sie durchkämmt. Das Projekt scheiterte schließlich, doch die einzelnen Ideen werden weiterverfolgt.

Aus der Quaero-Idee entstand die auch in einer deutschen Version verfügbare Suchmaschine Exalead. An Google reicht sie zwar nicht heran, was die Menge der Suchergebnisse angeht. Allerdings bietet Exalead einige nette Zusatzmerkmale. So kann man sich beispielsweise schon bei den Suchergebnissen kleine Vorschaubilder der gefundenen Seiten einblenden lassen - oft reicht das, um Seiten zu beurteilen.

In Deutschland konzentrierten sich die Anstrengungen auf das Projekt Theseus. Anstatt wie die Franzosen einen Anti-Google marktreif zu machen, geht es den Deutschen um Grundlagenforschung. Wie bringt man Suchmaschinen bei, Anfragen nicht bloß als Buchstabenfolgen zu betrachten und die Ergebnisse nahezu ausschließlich nach den Regeln der Mathematik zu gewinnen? Wunschtraum aller Beteiligten wäre eine "Antwortmaschine", wie sie Visionäre in den sechziger Jahren des vergangenen Jahrhunderts für möglich hielten.

Man tippt eine Frage ein, das System erkennt und beantwortet sie. Die Frage "Wer schrieb Krieg und Frieden" beispielsweise ließe sich damit einfach beantworten: Leo Tolstoi. Herkömmliche Suchmaschinen jedoch liefern als Antworten wenig Hilfreiches, so beispielsweise den Verweis auf eine Quizseite, wo ebenfalls die Frage gestellt wird, die man eigentlich gerne beantwortet gehabt hätte.

Bei dem öffentlich geförderten Projekt Smart Web entwickelten insgesamt 16 Partner aus Industrie und Forschung im Hinblick auf die Fußball-WM in Deutschland Anwendungsbeispiele für eine solche intelligente Suchmaschine, die sich auch über Sprache steuern lässt. Das System fand immerhin auf Anhieb die Antwort auf die Frage, wer 2006 bei den Salzburger Festspielen die Titelrolle in Verdis "Traviata" gesungen hatte: Anna Netrebko. Dabei war es eigentlich speziell auf Sport und die Fußball-WM getrimmt worden.

Mit dem Theseus-Projekt wird diese Arbeit nun fortgeführt. Ziel ist das sogenannte semantische Web. Dieses funktioniert aber - vereinfacht dargestellt - nur dann richtig, wenn Menschen die Texte, Bilder, Ton- und Videodateien zuvor klassifiziert haben. Unter anderem ruhen die Hoffnungen der Forscher darauf, dass die Nutzer des Internets selbst dafür eingespannt werden könnten, ihre Bilder und Filme zu beschreiben, ihre Texte bestimmten Kategorien zuzuordnen.

Zwar versprechen das auch automatische Verfahren, die Ergebnisse aber reichen an eine menschliche Einordnung bei weitem nicht heran. Zu den besseren Systemen auf dem Markt gehört die "Sense Engine" des bekannten britischen Linguisten David Crystal, die für die Werbebranche dafür sorgt, dass die passende Werbung zu Textinhalten auf einer Seite angezeigt wird. Auf die Mitarbeit der Nutzer setzt auch das bis dato wenig erfolgreiche Projekt Wikia Search des Wikipedia-Mitbegründers Jimmy Wales.

Dass die Dominanz der US-Firmen durch einen neuen Player auf dem Markt gebrochen werden könnte, erscheint nicht besonders realistisch. Die Amerikaner stecken nicht nur Hunderte Millionen Dollar in Forschung und Entwicklung, auch das Betreiben ihrer gigantischen Rechnerfarmen verschlingt Unsummen. Für eine einzige Google-Anfrage werden oft Tausende Rechner zugleich angefragt und die Einzelergebnisse dann gewichtet, dazu prüfen noch weitere Rechner, ob sich der Internetnutzer nicht vielleicht verschrieben hat und ganz etwas anderes meinte. Damit können Neulinge kaum konkurrieren.

© SZ vom 25.4.2008/mri - Rechte am Artikel können Sie hier erwerben.
Zur SZ-Startseite
Jetzt entdecken

Gutscheine: