Google kan nu beter Engels, en dat merk je in de zoekresultaten
Google heeft zijn zoekmachine aangepast om te focussen op natuurlijke taal in plaats van op zoekwoorden. Dat zou de zoekresultaten tot tien procent moeten verbeteren, toch in het Engels.
Techgigant Google is veranderingen aan het maken aan zijn zoekalgoritme. Daarmee zouden tot een tiende van de zoekopdrachten in de toekomst een ander resultaat kunnen terugkrijgen. De veranderingen zijn gebaseerd op technologie rond het verwerken van natuurlijke taal en komen er in het kort op neer dat de zoekmachine meer naar context gaat kijken.
Google zegt dat het nu beter begrijpt hoe woorden in een (Engelstalige) zin aan elkaar gelinkt zijn. Een voorbeeld dat het bedrijf in zijn blogpost over het nieuws geeft, is de zin (vertaald) “Kan je medicijnen ophalen voor iemand in de apotheek?”. De ‘oude’ Google zou die zin bekijken als een hoopje woorden en er de belangrijke woorden, zoals medicijnen en apotheek, uithalen om zijn zoekresultaten op te baseren. De nieuwe versie kijkt naar ‘voor iemand’ en begrijpt dat de vraagsteller wil weten of je iemand anders zijn voorschrift kunt oppikken. Het gaat dan ook andere resultaten geven.
Het nieuwe algoritme is gebaseerd op BERT, Bidirectional Encoder Representations for Transformers, een manier in natural language processing (NLP) om naar een hele zin te kijken, in context. Om het algoritme al die context en betekenis aan te leren, gebruikte de techgigant een neuraal netwerk. Ze gaven het netwerk een volledig corpus Engelse zinnen, maar haalden er willekeurig 15 procent van de woorden uit. Vervolgens kreeg de software de opdracht om uit te vissen welke woorden er vermist waren. Dat soort training zou goed zijn om het NLP-model te leren begrijpen hoe woorden in context met elkaar interageren.
Het nieuwe algoritme werd de voorbije dagen uitgerold en zou effect kunnen hebben op zo’n tien procent van de zoekopdrachten. Gezien de miljarden zoekopdrachten die er dagelijks in ‘s werelds meest gebruikte zoekmachine worden ingegeven, is dat een stevige stap. Google wijst er dan ook op dat de nieuwe zoekresultaten de eerste maanden zullen worden nagekeken, onder meer door een legertje eigen reviewers. Een van de problemen met een neuraal netwerk is namelijk dat je niet echt weet waarom het netwerk beslissingen neemt, en dat er vooroordelen in kunnen sluipen die misschien onbewust in de database zaten. Met een gigantische reeks zinnen lijkt dat laatste bijna onvermijdelijk. Het bedrijf geeft zichzelf dus nog de kans om een en ander te tweaken.
De veranderingen komen in de eerste plaats naar zoekopdrachten die in de Verenigde Staten in het Engels worden uitgevoerd. Andere talen en landen komen later.
Fout opgemerkt of meer nieuws? Meld het hier