AI heeft de mainstream bereikt. De voorbije maanden leek geen krant of journaal compleet zonder een bijdrage over ChatGPT. Maar hoe kijken AI-bedrijven zelf naar die schijnbaar plotse interesse bij het grote publiek?

“Wij zien AI in de eerste plaats als de technologie die voor een productiviteitsrevolutie zorgt”, zegt Nicolas Deruytter, CEO bij ML6. Het bedrijf ging in 2013 vanuit Gent van start met de ontwikkeling van AI-oplossingen. Intussen telt de volledige groep 120 medewerkers en zijn er ook kantoren in Amsterdam, Berlijn en Zürich. “Die sprong in productiviteit zullen we op heel uiteenlopende manier bereiken. We zien dat nu al in toepassingen volgens het principe text to…” Wie niet kan tekenen, kan met AI via tekst vandaag wel een opdracht geven om iets te laten tekenen. Bij een toepassing als Stable Diffusion kan iedereen daar intussen online mee experimenteren.

Open en vrij toegankelijk

“Tot nu toe kwam AI vooral tot uiting in puntoplossingen”, zegt Nicolas Deruytter. “Voor de automatische verwerking van documenten in een bank, bijvoorbeeld.” Vandaag ziet de sector een duidelijke versnelling in adoptie van die vorm van AI. “Maar ik ben vooral enthousiast over de transformationele kant van AI. Veel van wat nu gebeurt, is heel open en vrij toegankelijk. ChatGPT, bijvoorbeeld, is met open source gebouwd. Het betekent dat wij met ML6 bedrijven kunnen helpen eigen datasets te maken voor ChatGPT.”

Dat opent de weg naar specifieke toepassingen, op maat van bedrijven. “Je moet het zo zien”, zegt Deruytter. “Met Stable Diffusion kan je een beeld genereren van Poetin op een paard, maar daarmee heb je nog geen kant-en-klaar design voor een T-shirt. Anders gezegd: je moet de AI-component nog aanpassen en inbouwen in je bedrijfsproces.”

Kleiner is beter

Een opvallende tendens is alvast dat die generatieve AI-modellen heel snel heel klein worden. “Het getrainde model van Stable Diffusion is op een half jaar gekrompen van 200 GB tot een paar MB, waardoor je het nu ook op de telefoon kunt gebruiken”, legt Deruytter uit. Een mogelijk voordeel van die evolutie is dat het de kans verkleint dat er rond AI een nieuwe Google ontstaat: een bedrijf dat een hele sector domineert en controleert. “Klein werken is interessanter”, vindt hij, “met een model dat is gefinetuned voor je eigen bedrijf, je eigen sector, je eigen land.”

In die context ontstaat er een belangrijke nieuwe rol: die van het datanutsbedrijf. Dat waakt over de data waarmee dat bedrijf, die sector of dat land het eigen model voedt. “Het slechtste wat je als bedrijf vandaag kunt doen, is een fenomeen als ChatGPT weglachen”, stelt Deruytter. “Of je het nu wil of niet, AI breekt door. De vraag is enkel nog hoe je daar als bedrijf zelf mee wil omgaan.”

Waarde vandaag en morgen

“Het aantal parameters en het absorptievermogen om kennis en relaties op te slaan, neemt toe”, zegt Laurent Sorber, CTO bij Radix, een Belgisch bedrijf dat AI-oplossingen bouwt voor onder meer farma, transport, media en hr. “Daardoor zullen GPT-gebaseerde toepassingen in de toekomst meer kennis bevatten en ook minder fouten maken in het gebruik ervan.” GPT staat voor Generative Pre-trained Transformer. ChatGPT is momenteel het bekendste voorbeeld van een oplossing die op een GPT steunt. Volgens Sorber is ook de RLHF-dimensie belangrijk in het kader van GPT-technologie: Reinforcement Learning from Human Feedback. “Dat zorgt voor de selectie van informatieve antwoorden uit alle statistisch waarschijnlijke antwoorden.”

Stable Diffusion beeld met input: ‘show putin on a horse in a realistic way on a sunny beach’

OpenAI, het bedrijf achter ChatGPT, wil op termijn naar AGI toewerken: Artificial General Intellicence. “De potentiële waarde daarvan is nog groter”, zegt Sorber, “want vanaf dan spreken we over de capaciteit om elke intellectuele taak die een mens kan uitvoeren te begrijpen of te leren.” Sam Altman, de CEO van OpenAI, zegt dat AGI de ‘light cone of all future value’ zou kunnen vangen.

Het kapitaal dat Microsoft in OpenAI pompt, zal die evolutie hoe dan ook versnellen. Microsoft maakt duidelijk een onderscheid tussen de waarde die ChatGPT vandaag heeft en het potentieel ervan in de verdere toekomst. “De verwachting is dat Microsoft ChatGPT zal integreren in Office, bijvoorbeeld om slides te maken of om een aanzet te geven voor een Word-document.” Zo komen we uit bij wat ook Nicolas Deruytter van ML6 aanhaalde: het gaat om productiviteitswinst.

Wat met onze data?

Dat roept natuurlijk meteen vragen op over de persoonlijke data van gebruikers en wie daarover zal beschikken. Laurent Sorber nuanceert: “In Europa kennen we een heel sterke bescherming van de persoonsgegevens die we genereren. Ook Microsoft zal moeten voldoen aan de GDPR wanneer het bedrijf met onze data werkt.” Veel hangt daarbij af van de deal die Microsoft en OpenAI zullen sluiten. “OpenAI is gestart met de filosofie om te voorkomen dat AGI ooit in handen van één entiteit zou komen. Of ze bij OpenAI die filosofie ook in de toekomst blijven eren, weten we uiteraard niet.”

Sorber verwacht op korte termijn een verbetering van de duidelijke huidige tekortkomingen van ChatGPT, zoals bronvermelding waarmee u de gegeven antwoorden kan controleren en interactie met foto’s en audio die u ingeeft. “Maar we zullen ook de eerste kleine stappen richting AGI zien, zoals de mogelijkheid om te redeneren en antwoorden stapsgewijs uit te leggen.”

AI doorzoekt alles

Niet alle AI-toepassingen zijn zo mediageniek als ChatGPT, al blijken ze vaak minstens even spectaculair. Een mooi voorbeeld is Nuclia, een start-up uit Barcelona die de klassieke zoekfunctie volledig hertekende door AI aan de mix toe te voegen. “We bouwden vroeger intranettoepassingen voor ondernemingen”, zegt CEO Eudald Camprubi. “Klanten klaagden er vaak over dat het moeilijk was om op zo’n intranet informatie te vinden.” Dat vormde meteen het idee voor het huidige Nuclia.

Zowat tachtig procent van de data die een onderneming in huis heeft, is ongestructureerde data. “Alles indexeren? Dat is heel moeilijk”, stelt Camprubi, “ook al omdat die data niet ergens allemaal netjes samen staan: ze staan op SharePoint, op AWS, in allerhande formaten en lokale talen. Met een klassieke zoekopdracht en zoektermen spring je dan niet ver.” Nuclia bedacht daarom een nieuwe benadering: een snelle manier om ongestructureerde data te indexeren, gecombineerd met een zoekfunctie, telkens ondersteund door AI die steunt op taalmodellen. Het concrete resultaat is een low-code API. “Zonder dat je code moet schrijven, kun je een Nuclia-zoekvenster toevoegen aan eender welke applicatie.” Uiteraard moet Nuclia eerst de data indexeren die u doorzoekbaar wil maken: niet alleen Word-documenten en pdf’s, maar ook foto’s, audio, video, enzovoort. Wat Nuclia daarmee doet, gebeurt allemaal op Google Cloud.

Naar de juiste passage

Een voorbeeld maakt duidelijk hoe het werkt. Eind oktober vond er in Namen een conferentie plaats voor gebruikers van de CMS-oplossing Plone. Alle presentaties van de conferentie staan op YouTube. Maar hoe vind u daarin ooit terug wat u zoekt? “De organisatie heeft de URL’s van de video’s doorgegeven aan Nuclia”, zegt Eudald Camprubi. Achter de schermen zorgt Nuclia voor speech to text, waarna de oplossing de inhoud automatisch indexeert. “Wie info zoekt rond een specifieke topic, schrijft nu gewoon een zoekterm in het zoekvenster op de site van de conferentie.”

Stable Diffusion beeld met input: ‘robot with easle painting a picture in the style of cezanne’

Nuclia geeft als resultaat niet alleen één of meer video’s weer, maar ook de exacte passage in die video’s waarin de zoekterm voorkomt. Pittig detail: Nuclia ondersteunt intussen 101 talen. “Taal is geen barrière”, besluit Camprubi. Een zoekopdracht in één specifieke taal levert mogelijk ook resultaten op in documenten, video’s, of wat dan ook, in andere talen. Nuclia ziet mogelijke toepassingen van zijn product onder meer in ziekenhuizen, overheidsdiensten, universiteiten en klantendiensten. Ook hier is het beoogde doel duidelijk: productiviteitswinst.