Hoe AI leert van de wereld: ‘Door context in kaart te brengen, evolueert deep learning naar menselijk gezond verstand’
In weinig techsectoren beweegt er momenteel zo veel als in die van artificiële intelligentie. De technieken om aan machine learning en deep learning te doen worden aan sneltempo verbeterd. En een van de richtingen waarnaar men kijkt is … context.
Context is belangrijk. De zin “De vorst komt eraan” kan bijvoorbeeld zowel op een koning als op een koufront slaan, afhankelijk van waar het gesprek plaatsvindt: staat de spreker voor een bushok ergens in de late herfst, of op een van vlaggen en fanfare voorziene parade? Het verschil in betekenis voelen mensen bijna instinctief. Het is dan ook iets waar wij goed in zijn, maar computers voorlopig iets minder. Machine learning heeft software ondertussen geleerd om patronen in beelden te analyseren, en zo bijvoorbeeld menselijke gezichten te herkennen, maar om echt goed te worden moet ze ook met de context van die gezichten leren omgaan. Het is dan ook geen verrassing dat ‘contextual deep learning’ aan een opmars bezig is.
Neurale netwerken en hersenen
Het label ‘contextual deep learning’ slaat meestal op een vorm van machine learning die gebruik maakt van neurale netwerken. En die zijn, in grote lijnen, gebaseerd op het menselijk brein. Onze hersenen analyseren de wereld rondom ons op bijna permanente basis en leggen verbanden tussen alles wat onze ogen waarnemen. Ziet u door het raam iemand met een paraplu over straat lopen, dan weet u, zonder de echte druppels te zien, dat het waarschijnlijk regent. Wanneer we iets zien, leggen we verbanden tussen elk object dat we waarnemen, op basis van wat we geleerd hebben in het verleden. En in België is ‘regen + paraplu’ nu eenmaal een verband dat we vaak tegenkomen.
Als een boot in het midden van een stad gezien wordt, is dat voor ons raar, maar een hedendaags deep learning netwerk gaat zich daar geen vragen bij stellen.
Onze hersenen proberen dus te begrijpen wat onze ogen waarnemen, en dat begrip hebben we grotendeels geleerd door herhaling. We leren kinderen aan wat een bal is, door hen een bal te geven, met de vermelding (tot honderden keren toe), dat het een bal is. En zo werkt dat met alles in de omgeving van een kleuter: de lucht, de hond, de kat, oma, boek.
Computers leren om de wereld te zien
Het is dan ook geen gek idee om computers aan te leren om dingen te herkennen, door hen miljoenen beelden te geven en de les te herhalen tot ze daarin patronen beginnen te zien. Pluizig beest met een specifieke vorm, scherpe oortjes, twee ogen en specifieke snorharen: waarschijnlijk een kat. En de context van die kat zit meestal al een beetje in het geheel ingebakken, zegt Jonathan Berte, CEO van Robovision, dat gespecialiseerd is in beeldherkenning. “Deep learning is sowieso contextueel, ” vertelt Berte, “omdat de technologie zelf in de context dingen gaat opzoeken. Wanneer een beeld de omgeving van bijvoorbeeld een voetganger of een kat aanleert, wordt die deel van het algoritme.” Maar dat betekent nog niet dat de machine ook echt naar die context op zoek gaat.
Tenzij we gaan kijken naar convolutionele netwerken. Dat is de ietwat tongbrekende naam voor de structuur van de neurale netwerken die het vaakst gebruikt worden om beelden te herkennen. Daarbij zal een ‘gewoon’ neuraal netwerk de input die het krijgt transformeren door een reeks verborgen lagen sturen en hem zo transformeren. Elk van die lagen bestaat uit een set neuronen, en elke neuron in de laag is verbonden met elke neuron in de volgende laag. De laatste laag is de output laag, die alle voorspellingen moet maken.
Deep learning systemen zijn aan het evolueren van idiots savants, systemen die één ding erg goed kennen, naar bredere intelligentere systemen
Voor een convolutioneel neuraal netwerk worden extra lagen gecreëerd. “Die convolutionele lagen kan je zien als mini-oogjes die de informatie scannen en steeds beter zoeken naar een naald in een hooiberg”, legt Jonathan Berte uit. In dit soort netwerk zijn ook niet alle neuronen verbonden met die in de volgende laag. Ze worden gegroepeerd in kleinere regionen en zijn zo wat meer doelgericht. “Het is een filter die je over je matrix laat gaan. Die gaat eerst alles beginnen detecteren en met elke iteratie worden die filters beter. Als zo’n filter katten moet detecteren, zal hij gestimuleerd worden om de typische katachtige dingen te gaan minen. Oortjes, snorharen enzovoort. Die katachtige eigenschappen worden opgezocht en verfijnd om ze te gaan samenballen. Maar om die katten te detecteren heb je ook de context nodig, want een kat op zee, dat is vrij zeldzaam, omdat een diep neuraal netwerk ook die context meeneemt.”
Een en ander heeft tot gevolg dat dit soort netwerken makkelijker kan worden ‘bijgetraind’. Met een dure term heet dat ‘transfer learning’. “Als je een netwerk alle mogelijke dieren laat leren, dan is dat netwerk in een betere positie om nieuwe dieren te leren, ” legt Berte uit. “Als je dat op allemaal zoogdieren gaat trainen, gaat die oogdetector al vrij degelijk zijn voor katten, en dan moet die niet meer van nul beginnen voor honden.” Het concept ‘pootjes’, ‘staart’ en ‘neus’ zijn al aan boord, zo luidt de redenering, dus andere dieren met die eigenschappen kunnen sneller aangeleerd worden.
Voorbij beeldherkenning
De meeste voorbeelden van AI en machine learning komen uit beeldherkenning, maar daar blijft het natuurlijk niet bij, zegt Berte. “Deze technologie werkt in principe voor vrijwel alle tijd-ruimte netwerken. Denk bijvoorbeeld aan een sociaal netwerk. Als je een crimineel bent en al je onfrisse vriendjes zitten ook in je netwerk, dan gaat die machine begrijpen dat mensen in die context mogelijk gelijkaardig zijn. Of dat ze minstens een gelijkaardig milieu leven.” Mocht u zich ooit afvragen hoe het komt dat Facebook uw job, opvoeding of zelfs geaardheid kan voorspellen voordat u er zelf mee uitkomt: welaan. Mensen met dezelfde interesses gaan nu eenmaal vaker met elkaar om.
Opvallender is dat dit soort technologie ook, deels, aan de basis ligt van de oneindige informatiehonger van giganten als Google of, wederom, Facebook. Zij willen namelijk niet per se die job en geaardheid kunnen voorspellen, maar vooral de shampoo of smartphone die ze u het best kunnen verkopen. “De informatievector stopt nooit”, zegt Berte. “Als je iemand beschouwt als informatievector: die is van dit geslacht, is zo groot etc., dan kan je die informatie verrijken en verzamelen, maar dat stopt nergens. Als persoon beweeg je door een stad en ga je op café, daar komt altijd gedrag bij. Je kan heel die context erbij voegen.”
Richting algemene intelligentie
Waar is dat allemaal goed voor? Omdat context belangrijk is, en hoe meer context, hoe meer verbanden, des te slimmer de machine. Waar onderzoekers vroeger machine learning konden inzetten om een kat te leren herkennen, en dan opnieuw moesten beginnen voor honden, geven de convolutionele lagen de AI de kans om sneller nieuwe dingen te leren.
Door context meer in kaart te brengen, evolueren deep learning systemen meer naar menselijk gezond verstand.
“Het is een stap in de richting van een artificial general intelligence of AGI”, zegt Berte. “Deep learning systemen zijn aan het evolueren van idiots savants, systemen die één ding erg goed kennen, naar bredere intelligentere systemen, en zo’n breder systeem houdt altijd rekening met de ruimere context, meer dan specifieke expertise op één domein. Als een boot in het midden van een stad gezien wordt, is dat voor ons raar, maar een hedendaags deep learning netwerk gaat zich daar geen vragen bij stellen. Door context meer in kaart te brengen, evolueren die deep learning systemen meer naar menselijk gezond verstand. Zo’n systeem kan uitleggen waarom het bepaalde stappen neemt.”
Zijn we dan toch AI aan het aanleren slimmer te worden dan de mens? “AI is op vele domeinen veel slimmer dan mensen, maar waar mensen veel slimmer in zijn, is gezond boerenverstand, en door die context meer in rekening te brengen, kunnen we die systemen meer performanter maken.”
Fout opgemerkt of meer nieuws? Meld het hier