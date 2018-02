Het DeepMind team, bekend van de AlphaGo-algoritmes die de beste Go-speler hebben verslagen, heeft een manier ontwikkeld om haar artificiële intelligentie sneller nieuwe dingen te leren. De nieuwe training kreeg de naam Importance Weighted Actor-Learner Architectures (IMPALA).

De onderzoekers stellen de AI bloot aan een hele reeks videogames tegelijk. IMPALA zorgt ervoor dat de neurale netwerken zijn onderverdeeld in 'spelers' en 'leerlingen'. Bij de oude methode gaf de computer inputs aan de controller, zoals een menselijke gamer dat zou doen. Met het nieuwe framework doorloopt de AI nu 30 spellen tegelijk, en alle info van de 'spelers' wordt gebundeld in de netwerken van de 'leerlingen'. Volgens de onderzoekers voert de AI met IMPALA haar opdracht 10 keer efficiënter uit, vergeleken met vroegere methodes.

Voorbereiden op het echte werk

Daarnaast zorgt het multitasken ervoor dat de neurale netwerken sneller nieuwe informatie kunnen opnemen. De grootste uitdaging voor AI is momenteel om de snelheid te verbeteren waarmee neurale netwerken nieuwe dingen kunnen leren. Als AI ooit in staat moet zijn om bijvoorbeeld volledig een zelfrijdende wagen door allerlei lastige verkeerssituaties te loodsen, is het belangrijk dat de software op alles is voorbereid. Simulaties, zoals het spelen van videgames,vormen één van de methodes die artificiële intelligentie moeten voorbereiden op het echte werk.

Volgens de wetenschappers van DeepMind verwerkt IMPALA 250.000 frames per seconde, of 21 miljard frames per dag. Op die manier heeft Google met de systemen van haar DeepMind-team de snelste gegevensverwerking door AI in handen

