Bild nicht mehr verfügbar.

Googles "Magie" hinter der Suchmaschine: Algorithmen 

Foto: AP Photo/Universal Studios

Seit Jahren dominiert Google das Web als größte Suchmaschine. Das Unternehmen aus Mountain View, das Ende der 90er Jahre von Larry Page und Sergey Brin gegründet wurde, verbucht weltweit knapp 86 Prozent aller Suchanfragen im Web. Seit langem versuchen Konkurrenten sich ihr Stück vom Kuchen des Suchmaschinenmarktes zu sichern. Microsoft hat seine Suchmaschine vergangenes Jahr vollkommen neu überarbeitet, Millionen von Dollar hineingesteckt und viel Lob dafür eingeheimst - Bings Anteile liegen global dennoch derzeit bei 3,17 Prozent. Der Grund wieso Google als Suchmaschine so erfolgreich ist, klingt wenig sexy: Algorithmen. Welche fantastischen "Zaubertricks" sich dahinter tatsächlich verbergen, hat sich Wired zeigen lassen.

Google versteht

Jährlich werden hunderte Verbesserungen an den Suchalgorithmen vorgenommen. Alle paar Jahre wird die Search Engine von Grund auf überarbeitet. Das hat dazu geführt, dass Google bei der Suche nach bestimmten Begriffen relevantere Ergebnisse als die Konkurrenz liefert. Am besten lässt sich das anhand der Suche nach "mike siwek lawyer mi" demonstrieren. Während Google erkennt, dass es sich dabei um den Anwalt Michael Siwek aus Michigan handelt, liefert Bing nur Ergebnisse, die dieser Wörter enthalten (den aktuellen Wired-Artikel ausgenommen). Der Clou hinter Google Suche ist: sie scannt das Web nicht nur nach den Wörtern, sondern erkennt auch den Zusammenhang, in dem sie stehen.

Am Anfang war PageRank

Googles Menü setzt sich aus zahlreichen Zutanten zusammen. Die erste davon war PageRank, das Mitgründer Larry Page 1997 entwickelt hat. Dabei handelt es sich um ein System, das Suchergebnisse danach reiht, wie viele und welche Links auf Seiten verweisen. Diese Links versteht Google als Hinweise darauf, wie wichtig die Ergebnisse für eine Suchanfrage sind. Seither sind viele weiterer Hinweise hinzugekommen. Später wurden beispielsweise der Seitentitel und der Text des Hyperlinks miteinbezogen. Derzeit bezieht Google etwa 200 solcher Hinweise in eine Suche mit ein, um dem User möglichst das zu liefern, was er tatsächlich sucht.

Auf den Kontext kommt es an

Dass eine Suchmaschine wirklich versteht, was Menschen suchen wenn sie beispielsweise "New York Times" eingeben, ist eine trickreiche Angelegenheit. Es reicht nicht nur, den von der Suchmaschine erstellten Index aller Websites nach den Wörtern zu durchforsten, denn dann würden wahllos Seiten gelistet, in den die Wörter "new", "york" und "times" vorkommen. Die Suchmaschine muss tatsächlich begreifen, dass es sich dabei um eine Zeitung handelt, dass mit der Suche nur nach "New York" wiederum die Stadt gemeint ist. Die Engine muss den Kontext einer Suchanfrage verstehen. Nur Wortsynonyme interpretieren zu können reicht nicht. So weiß Google, dass das Wort "puppies" (Welpen) als Synonym für "dogs" verwendet werden kann und "boiling water" ("kochendes Wasser") auch "hot" ist. Die Engine muss aber auch verstehen, dass "Hot Dogs" keine "boiling puppies" sind. Das wurde erreicht, indem die Suchmaschine auf den indexierten Websites auch die Worte neben den gefundenen Suchbegriffen einbezieht.

Twitter-Updates und Goggles

Mit Caffein, der jüngsten Überarbeitung der Engine, können Entwickler solche Hinweise schneller integrieren. Zu den aktuellsten Neuerungen zählen etwa die Integration von Twitter-Posts. Bei 50 Millionen Tweets am Tag muss Google gründlich aussortieren, welche Updates in den Suchergebnissen auftauchen - Retweets, wie viele Follower eine Person hat und ob das Tweet "manuell" verbreitet wurde, oder von einem Bot sind wichtige Kriterien. Eine weitere Entwicklung ist Goggles, bei dem User mit der Handy-Kamera aufgenommene Fotos als Suchanfragen dienen, beispielsweise um Informationen zu berühmten Gebäuden zu erhalten.

Der Motor ist nicht das Wichtigste

Die Konkurrenz versucht dieser Überlegenheit der Suchalgorithmen mit anderen Ansätzen entgegenzutreten. Bing gibt beispielsweise Auskunft über aktuelle Flüge oder Produktpreise. Es kommt nicht alleine auf den Algorithmus an, ist man bei Microsoft überzeugt. Man kauft ein Auto schließlich auch nicht nur wegen des Motors. Es könnte sich in Zukunft stärker herauskristallisieren, dass User für verschiedene Suchanfragen verschiedene Suchmaschinen verwenden. Die Redmonder nennen Bing daher nicht Such- sondern Entscheidungsmaschine. Auch Wolfram Alpha schlägt in diese Kerbe. Daneben existieren dutzende Seiten, die sich auf bestimmte Aufgaben spezialisiert haben. Bei der Aufgabe, die allgemeine Suchanfrage eines Users so zu interpretieren, dass die für ihn relevantesten Ergebnisse geliefert werden, ist Google nach wie vor aber unschlagbar. (red)