Wetenschap voor Dummies
- editie
- 504
- categorie
- alfawetenschappen
Omdat het geniale in het simpele schuilt, doen we tweewekelijks een wetenschappelijk concept op een belachelijk simplistische manier uit de doeken. Vandaag: de magie van Google.

Geen onderwerp zo obscuur, of Google weet het wel te vinden in de duistere krochten van het internet. Maar hoe haalt onze geliefde zoekmachine precies het gezochte uit die chaos? Om de twintig miljard pagina’s te indexeren, surft een machine voortdurend rond. Deze web crawler spoort moeiteloos het kleinste trema op. Nu vindt een doorsnee zoekmachine gemakkelijk willekeurige woorden terug. Het grote succes van Google schuilt in zijn snelheid en relevantie. Voer ik “Universiteit Gent” in als zoekopdracht, dan kom ik meteen terecht op de homepage van de UGent, zonder dat ik eerst tientallen nutteloze pagina’s moet doorworstelen.
Het geniale algoritme dat Google hiervoor gebruikt, PageRank, is gebaseerd op de structuur van het internet zelf. Sites zijn onderling verbonden door links. Hoe meer links er aankomen op een site, hoe belangrijker die is volgens Google. Maar als een belangrijke site nog eens doorverwijst, dan is de laatste in de rij zeker de moeite waard. Op basis daarvan geeft Google een cijfer. Dat cijfer staat los van de zoekterm, waardoor de zoektocht naar links, de relevantieberekening en de rangschikking slechts eenmaal moet gebeuren. Dat wint veel tijd en geeft ons in enkele centiseconden precies het nodige op ons beeldscherm.
Klinkt eenvoudig, ware het niet dat er een paar addertjes onder het gras schuilen. Ten eerste zijn niet alle twintig miljard pagina’s onderling verbonden. Vroeg of laat komen we terecht op een pagina zonder uitgaande links. Dan rest ons naar een willekeurige site te surfen. Deze dangling nodes zorgden voor ettelijke overkokende breinen bij de Googlemedewerkers, tot ze uitkwamen bij de goede, oude principes van de kansbereking.
De kans dat iemand doorklikt op een link wordt gelijkgesteld aan α, de kans dat er een nieuwe site wordt geopend aan 1-α. Giet deze twee factoren in een formule, voeg wat matrices en inventiviteit toe en je krijgt een schitterend wiskundig procedé, klaar voor gebruik.
Het grote geheim waardoor Google Inc. zijn miljarden kon vergaren, is de precieze waarde van α. Schattingen wezen op een getal in de buurt van 0,85, maar zo goed als niemand kent het exacte cijfer. Bovendien verandert α om de zoveel tijd, aangezien het internet ook voortdurend uitbreidt. Zelfs de topmathematici die meehelpen aan het schrijven van programma’s en algoritmes weten de precieze waarde niet. Ze werken dus steeds gedwongen met een onbekende factor. Alsof het nog niet moeilijk genoeg is. Al staat daar wel een riant salaris tegenover en een paradijselijke werkomgeving. Het hoofdkwartier van Google Inc. is uitgerust met diverse recreatieruimten, massagegelegenheden, een topkok die 24/7 vers voedsel bereidt enz. Kwestie van die creatieve breinen extra te stimuleren. Zo zie je maar weer: met Google vind je alles — behalve α dan.