Ruim tien jaar na de val van Lernout & Hauspie vindt spraaktechnologie langzaamaan haar weg naar de consument. Apple’s Siri en de eerste stemgestuurde televisietoestellen vormen de voorhoede van een nieuwe generatie revolutionaire gebruikersinterfaces. “Dankzij speech en natural language processing kan je heel wat stappen overslaan bij het zoeken naar informatie”, zegt cto Vlad Sejnoha van spraakherkenningsspecialist Nuance.
Siri, de intelligente ‘persoonlijke assistent’ van Apple die een tijdje geleden geïntroduceerd werd op de iPhone 4S, heeft nog geen onuitwisbare indruk gemaakt, of toch zeker niet in landen waar het Engels niet de voertaal is. En toch zouden bedrijven als Google en Facebook zich stilaan vragen moeten beginnen stellen, net als alle andere (mobiele) sites en toepassingen die afhankelijk zijn van reclame voor hun inkomsten. Waarom? Omdat een consument die praat met zijn toestel, niet langer naar het scherm zit te staren. Waarmee de huidige online reclamemodellen grondig overhoop gehaald worden.
“Siri heeft de nood aan visuele interactie met het scherm nog niet helemaal overbodig gemaakt, maar er zijn toch al zoekportalen die het effect beginnen te merken”, knikt cto Vlad Sejnoha van Nuance, de specialist in spraakherkenning en AI die een decennium geleden de activa van Lernout & Hauspie overnam, en vandaag samenwerkt met Apple.
Een voorbeeld? ‘Siri, call me a cab’ In plaats van de klassieke zoekopdracht waarbij de gebruiker een lijstje van taxibedrijven krijgt voorgeschoteld met daarnaast een rist adwords, doet Siri het vuile werk op de achtergrond, en belt de toepassing automatisch naar wat volgens haar AI-motor de meest geschikte dispatcher is.
Dat de stap met het zoekportaal geschrapt wordt, heeft nu al tot gevolg dat heel wat taxibedrijven in de VS zich anders beginnen te presenteren op het internet. Search engine optimization (SEO) wordt ‘Siri engine optimization’. In de Google-top drie staan, of afhankelijk zijn van adwords om je website bovenaan de gesponsorde links te krijgen, volstaat niet meer wanneer Siri overneemt.
De ‘Dragon Go’-app van Nuance voor de iPhone werkt op een gelijkaardige manier. Ben je op zoek naar een ‘ new Italian restaurant’, of wil je de ‘ screening times for The Iron Lady‘ weten, dan gaat de toepassing zelf op zoek naar de websites met de juiste informatie. De sites worden wel getoond (in de vorm van een carrousel), en ook de reclameboodschappen blijven zichtbaar, maar de tussenpersoon werd geëlimineerd. Of toch alleszins vanuit het perspectief van de consument. Het kan best zijn dat Google gebruikt werd om de zoekopdracht te voltooien. Maar van de zoekmotor die zich richt tot de consument is geen sprake meer.
“Speech en natural language search voegen nieuwe elementen toe aan de gebruikservaring”, knikt Sejnoha, die net zoals zo vele Nuance-werknemers ooit nog voor Lernout & Hauspie aan de slag was. “Interessant is dat je stappen kan overslaan bij het zoeken naar informatie. Je creëert eigenlijk een soort van shortcut tussen vraag en antwoord. Dat is een krachtig idee. En wat dat betreft staan we nog maar aan het begin.”
“Pas op: het is niet de bedoeling om de look and feel van de eindbestemming aan te passen”, benadrukt Sejnoha. “Onze toepassingen zijn geen filters, wel facilitators. Als je naar Yelp wil gaan, brengt Dragon Go je naar Yelp. Idem dito voor Amazon. Je krijgt de catalogus te zien zoals iedereen hem te zien krijgt. Als er bedrijven zijn die op Amazon willen adverteren, kunnen ze dat met andere woorden nog steeds doen. Maar klassieke zoekportalen zoals Google zullen naar de toekomst toe een ietwat andere rol moeten opnemen, zeker in de mobiele wereld.”
Watson
Als personal assistants zoals Siri al redelijk revolutionair lijken, dan vallen ze in het niets wanneer je gaat kijken naar wat er straks allemaal mogelijk is met behulp van artificiële intelligentie en ‘multimodale’ interactiemogelijkheden. “Telefoons zitten vandaag de dag al vol met sensoren die gebruikt kunnen worden voor de input van informatie”, klinkt het nog. “Geeft je telefoon je een antwoord dat je niet zint, dan kan je er even mee schudden om een nieuw antwoord te krijgen. Of in plaats van iets te zeggen of in te tikken, kan je je toestel gewoon richten naar een bushokje om enkele seconden later het uurrooster op een presenteerblaadje te krijgen. Voorts worden gebaren steeds belangrijker. Die kan je van tags voorzien om een zoekopdracht in gang te zetten. You ain’t seen nothing yet.”
Eens AI en ‘natural language processing’-toepassingen de kinderschoenen nog wat meer ontgroeid zijn, zullen telefoons, televisies en computers ook subtielere betekenissen gaan begrijpen. “Nuance werkt al een tijdje mee aan IBM’s Watson programma, waarbij we de technologie vragen laten beantwoorden na het scannen van grote databases. Daarbij is het de bedoeling om een zo gesofisticeerd mogelijke, genetwerkte AI-motor te creëren om semantische zoekopdrachten uit te voeren.”
Je wandelt rond in Brussel, en loopt voorbij een nieuw restaurant. Je veegt over je telefoon om je ‘persoonlijke assistent’ te activeren, je richt het toestel naar de eetgelegenheid en vraagt: “hoeveel punten kreeg dit restaurant van Weekend Knack?” De gps weet waar je je bevindt, het digitale kompas noteert naar welke richting je toestel ‘kijkt’, de user interface bevraagt de AI-servers in de cloud, terwijl de toepassing weet dat je op zoek bent naar de punten toegekend door Knack. De AI-motor plukt de gevraagde data van de site, en antwoordt ‘7,5 op 10’.
In een dergelijk scenario skipt de user interface niet één, maar verschillende toepassingen, zoals de maps app, de website van Knack, en de zoekmotor. In één adem zou je toestel op zoek kunnen gaan naar andere recensies op sites die je vertrouwt. De software zou zelfs kunnen checken of er gerechten op het menu staan die passen in je dieet. Of je contacten op Facebook al gaan eten zijn op die plaats, en wat ze er van vonden. De AI-motor ‘contextualiseert’ vervolgens al die informatie, en bepaalt welke eetgelegenheid het beste is voor de gebruiker.
Gatekeeper
Toestellen plukken tijdens zo’n semantische zoekopdracht informatie van tientallen verschillende sites, zonder dat de gebruiker hoeft te kijken naar zijn scherm, of naar de reclameboodschappen op dat scherm. Met andere woorden: de gebruikersinterfaces van de toekomst maken van hun ontwikkelaars belangrijke spelers op het internet. Meer nog: deze bedrijven worden in zekere zin zelfs de nieuwe ‘gatekeepers’ van de beschikbare informatie. Grote (online) merken hebben er in dat verhaal alle belang bij om verregaande partnerships af te sluiten met de ontwikkelaars van de interfaces (zoals Nuance). Internetbedrijfjes die niet uit zijn op een partnership, zouden zich wel eens in het hoekje gedrumd kunnen weten.
Natuurlijk kunnen de Googles en de Bings dezer wereld ook zelf multimodale gebruikersinterfaces ontwikkelen. Bij Google loopt er trouwens al een speechproject, onder de naam ‘Majel’. Zoekmotoren maken gebruik van AI om hun zoekresultaten te verfijnen. Heel moeilijk kan het voor hen dus niet zijn om een optimaal zoekresultaat tot buiten het scherm te brengen. Maar het keyword-gedreven business model eigen aan Google en Bing zou in een dergelijke context wel zinloos worden. En bovendien: hoeveel websites zouden het appreciëren als Google gaat lopen met alle waardevolle informatie, zonder dat daar iets voor in de plaats komt?
“Opnieuw: we zien Nuance als een ‘merkvriendelijk’ bedrijf”, besluit Sejnoha. “We minimaliseren met onze softwaretoepassingen het aantal tussenstations, en maken het gemakkelijker om informatie in één keer bij de gebruiker te krijgen. De traditionele searchbedrijven zullen creatievere business modellen moeten bedenken. Toch zal het scherm nooit helemaal verdwijnen. Er zijn informatiebronnen die altijd visueel moeten worden weergegeven. Een grafiek ga je nooit laten voorlezen door een stem, om maar één voorbeeld te geven. Maar in de gevallen waarbij het handiger is om de informatie off screen af te leveren, zullen de traditionele spelers nieuwe manieren moeten bedenken om de aandacht te trekken.”
Frederik Tibau
Fout opgemerkt of meer nieuws? Meld het hier