Nieuwe Go-computer doet het zonder hulp van de mens

DeepMind, Google’s onderzoekseenheid voor artificiële intelligentie, heeft een computer voorgesteld die zichzelf het bordspel Go volledig vanaf nul heeft aangeleerd. Haar voorganger, die wél nog gebruik maakt van menselijke data om bij te leren, versloeg ze met 100-0.

Go is een bordspel met 361 speelvelden. Bij elke zet zijn er zodanig veel mogelijkheden, dat het ontzettend moeilijk is om een computer te programmeren die het spel naar zijn hand kan zetten. Met de hulp van neurale netwerken lukte het Deepmind echter om een computer te maken die Go kon leren. ‘Leren’ mag je daarbij letterlijk nemen, want AlphaGo kreeg spelletjes van menselijke spelers voorgeschoteld en gebruikte die om zichzelf te ‘trainen’.

Vorig jaar won AlphaGo verrassend van de Koreaanse wereldkampioen Lee Sedol met 4-1, een mijlpaal voor het onderzoek naar artificiële intelligentie.

Tabula Rasa

Haar opvolger, AlphaGo Zero, moest het zonder menselijke hulp stellen. Ze kreeg enkel de regels uitgelegd en mocht het voor de rest allemaal zelf uitzoeken. Alpha Go Zero werd dan maar haar eigen lerares: ze speelde tegen zichzelf. Door aan beide kanten een paar zetten te proberen en de winstkansen te berekenen, begon Zero zich de kneepjes van het Go-spel eigen te maken. Na drie dagen trainen wist ze de vorige versie van AlphaGo honderd keer na elkaar te verslaan.

De werking van de nieuwe Go-computer werd door Deepmind beschreven in een artikel dat gepubliceerd werd in Nature. ”Dat het algoritme vertrekt van een onbeschreven blad, maakt het veel krachtiger dan de vorige versies. Door enkel de basisprincipes van het spel te gebruiken en geen menselijke data meer, hebben we de beperkingen van onze menselijke kennis omzeild’, aldus hoofdauteur David Silver.

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content