Gaan we nu eindelijk praten tegen computers?
Is het tijd om visuele computerinterfaces los te laten? Een Amerikaanse start-up opgericht door voormalige toppers van Salesforce en Google denkt van wel.
Van ‘Blade Runner’ over ‘Knight Rider’ tot ‘Star Trek: The Next Generation’: al bijna een halve eeuw lang maakt sciencefiction ons warm voor het idee van terugpratende computers. En nu willen de Amerikaanse ondernemers Bret Taylor en Clay Bavor ze eindelijk in ons midden brengen. Toch al zeker in digitale klantenrelaties, waarin ze met hun nieuwe start-up Sierra van conversational AI – het soort kunstmatige intelligentie dat zo goed menselijke interacties nabootst dat ze in dialoog kan gaan met de gebruiker – de interface willen maken die voortaan de leiding neemt. Scherminterfaces als websites en apps zullen snel in het peloton sukkelen, denken de twee.
“In de toekomst zal de AI-agent van een bedrijf – in feite de AI-versie van dat bedrijf – net zo belangrijk zijn als de website”, legde Taylor hun project uit tegen techblad Wired. “Het zal de manier waarop bedrijven digitaal bestaan volledig veranderen. Op dit moment is een bedrijfsapp een klein icoontje waar je naar wijst. Maar op welk punt zal het belangrijkste digitale artefact van een bedrijf de AI zijn?”
Praatjes maken
Bavor en Taylor zijn niet de minsten. Bavor werkte achttien jaar lang bij Google, wiens VR-afdeling en R&D-afdeling hij de afgelopen jaren leidde. Taylor verliet zijn positie als co-CEO van Salesforce om Sierra mee op te starten. Het bedrijf kan inmiddels al pronken met grote cliënten als Sonos en WeightWatchers. En hun technologie is niet die van de Siri’s of Alexa’s die we allemaal eventjes hebben geprobeerd, maar ook net zo lief weer achter ons hebben gelaten. De twee Sierra-oprichters voelen dat conversational AI een vooruitgang is die kan worden vergeleken met de grafische gebruikersinterface of de smartphone, en minstens evenveel impact zal hebben op ons leven. Ze verwijzen daarvoor graag naar ChatGPT, dat eind 2022 honderd miljoen gebruikers telde op slechts twee maanden tijd: een gebruikersaantal waarvoor TikTok negen maanden nodig had, en Instagram tweeëneenhalf jaar.
Conversational AI zit op een kruispunt van big data, machine learning en natural language processing, drie componenten in de ontwikkeling van kunstmatige intelligentie die de afgelopen jaren een flinke vlucht vooruit hebben genomen. In het geval van Sierra worden daar ook agents aan toegevoegd: autonoom werkende AI-instanties, die al breed worden ingezet in academische AI-research (om kunstmatige intelligentie te trainen op videogames bijvoorbeeld), maar tot dusver nog niet veel commerciële toepassingen vonden.
Al die elementen samen zorgen ervoor dat de nieuwe generatie chatbots een ‘echte’ conversatie met de gebruiker kan voeren, en die ook kan verderzetten bij een volgend contact. “Twee cruciale stappen voor conversational AI zijn gezet”, zegt professor Steven Latré, die de AI-inspanningen van technologie-instituut imec leidt. “De eerste stap, die helemaal teruggaat tot de dagen van Lernout & Hauspie, was begrijpen wat de gebruiker precies vraagt. Die horde is inmiddels genomen. Maar de tweede stilaan ook: kunstmatig intelligente systemen die iets deftigs teruggeven. Die uit de data die ze tot hun beschikking hebben effectief iets relevants opdiepen, en dat helder communiceren naar de gebruiker. Technologisch zijn we op een punt beland waar die systemen eindelijk intelligent genoeg zijn geworden.”
UI > AI
Maar wìllen we dat wel, alleen maar praten of chatten met een computer? Frederik De Bosschere, lead strategist bij digitale studio In the Pocket, ziet chatbots – hoe geniaal ze ook worden – niet snel visuele en tactiele interfaces verdringen. “Ons collectieve optimisme over AI wordt al te vaak aangestuurd door een scifi-beeld over kunstmatige intelligentie”, zegt hij. “De eerste golf van chatbots, rond 2016, is met een flinke sisser afgelopen omdat we toen te snel hebben verwacht dat die natural language processing-toepassingen de intentie van een mens konden capteren: ze bleven een soort virtuele keuzemenu’s. Zelfde met die smart home-speakers van Google en Amazon, die iedereen ineens in zijn huis begon te installeren om er twee keer het licht mee aan te doen. Nu large language models het overnemen zal het misschien beter lukken om dichter bij die menselijke intenties te komen, maar je moet als bedrijf dat die technologie gebruikt om te communiceren met zijn klanten ook een back-end hebben die daarin kan volgen. Good old-fashioned UI is bovendien iets wat al meerdere keren werd doodverklaard in het verleden, en ook deze keer zal dat zeer voorbarig zijn. Het belangrijkste argument voor een klassieke gebruikersinterface is dat die de gebruiker gidst; wanneer het uitsluitend met je stem moet gebeuren, sta je er helemaal alleen voor.”
Pizza’s voorlezen
Er is ook de vraag of we als gebruikers wel veeleisend genoeg zijn naar kunstmatige intelligentie toe. Het Amerikaanse magazine The Atlantic maakte zopas een solide punt wat dat betreft: het lijkt wel alsof een reis boeken in jouw plaats als het nec plus ultra wordt beschouwd van wat een generatief artificieel intelligente chatbot voor je kan doen. Dat geven tenminste Microsoft, Google, Meta en andere grote spelers in het veld aan. Terwijl de ware test zal schuilen in hoe conversational AI zich van àlle consumentenvragen – hoe simpel of complex ook – zal kunnen kwijten, en dat even goed als de interfaces die we al twintig tot dertig jaar gewend zijn.
‘Ons collectieve optimisme over AI wordt al te vaak aangestuurd door een scifi-beeld over kunstmatige intelligentie’
“Een vlucht boeken lijkt me iets waarvoor de gebruiker bij uitstek naar enige guidance zoekt, en daar is tekst- of stemcommunicatie via generatieve AI gewoon niet goed in”, zegt De Bosschere. “En ga jij bij het doorgeven van een bestelling bij Domino’s Pizza eerst drieëndertig verschillende pizzavariaties laten voorlezen? Goeie UX geeft richting in een digitale ontmoeting met de klant, dat blijft iets heel robuusts. Ineens is er die enorme obsessie voor tekstcommunicatie met een ‘menselijke’ computer, maar we moeten hier echt landen op de klassieke dooddoener dat AI en UI complementair zullen worden met elkaar. Want dat klopt natuurlijk ook: via een chatbot op LLM-technologie kun je een klant of bezoeker heel specifieke antwoorden op heel specifieke vragen doorgeven. Maar er wordt nu wat verwacht dat AI de bovenhand zal nemen, en ook die slag zal UI winnen. Het is nu alsof men zegt: ‘We hebben eindelijk een goeie hamer, laat ons dus overal spijkers in slaan’. Zo werkt het natuurlijk niet.”
Intuïtie toevoegen
Die complementaire taak wordt door de huidige generatie chatbots echter niet naar behoren gedaan. Computergestuurde telefoonondersteuning of bestaande chatbots in de rechteronderzijde van een websitescherm zijn meestal nachtmerries. Wanneer die dus beter worden, aangedreven door conversational AI, zullen ze dus eindelijk misschien deftig nààst gewone AI kunnen staan. “Ik zie conversational AI vooral een verschil maken op die punten waar ze intuïtie toevoegt aan bestaande gebruikersinterfaces”, zegt Latré. “Adobe doet dat bijvoorbeeld bijzonder goed met de AI-bot in PhotoShop: dat is een notoir complex programma, met heel veel functies waar je als gebruiker maar doorheen moet speuren voor een relatief eenvoudige taak als de achtergrond van een foto veranderen. Wanneer je zoiets voortaan ook via een prompt kunt doen, neem je echt een welgekomen binnenweg.”
Fout opgemerkt of meer nieuws? Meld het hier