Nog even wachten op ‘Babel Fish’-achtige vertaaltechnologie

© Getty Images
Ronald Meeus
Ronald Meeus Freelance journalist

Meer en meer techmerken, waaronder volgens Bloomberg nu ook Apple, pakken uit met een vertaalfunctie in hun oortelefoons. Maar de al zeer lang gekoesterde droom van een universele vertaler ligt niettemin nog ver voor ons uit: daarvoor is taal – zeker in gesproken vorm – voorlopig nog wat te ongrijpbaar om voldoende te worden gevat door kunstmatige intelligentie.

Apple, zo zegt tenminste zakelijk persbureau Bloomberg op basis van anonieme bronnen, is bezig aan vertaaltechnologie in zijn AirPods: wanneer iemand de drager aanspreekt in een vreemde taal, worden de woorden in kwestie automatisch omgezet naar de taal die de eigenaar van de oortjes spreekt. De nieuwe feature zou meekomen met iOS 19 later dit jaar.

De Amerikaanse fabrikant verschijnt daarmee zoals steeds laat op het feest, want andere techmerken hebben al eventjes een kunstmatig intelligente tolk in hun oortjes zitten. Google pakte er zelfs in 2017 al mee uit in zijn Pixel Buds, Xiaomi heeft instant-vertaaltechnologie in zijn Buds 5 Pro zitten, net als Samsung in zijn Buds 3 Pro. Gespecialiseerde fabrikanten als Timekettle en Vasco zetten bovendien in op eigen – volgens henzelf uiteraard nog betere – vertaaltechnologie.

Universele vertaler

In het domein van de sciencefiction wordt er al decennialang gedroomd van de een technologie die gesproken taal van over de hele wereld – of in veel gevallen zelfs het volledige heelal – simultaan kan vertalen. In de komische scifiromanreeks The Hitchhiker’s Guide to the Galaxy liet schrijver Douglas Adams dat vertaalwerk uitvoeren door de Babel Fish, een buitenaards visje dat gebruikers in hun oor stoppen waarna het zich voedt met hersengolven van mensen in de omgeving en zo hun gesproken taal tolkt naar die van de drager.

Misschien nog bekender onder scifi-adepten is de universal translator in televisiereeks Star Trek: ten tijde van de oude reeks moest Captain Kirk daar een staafvormig object voor hanteren, in The Next Generation zat de vertaaltechnologie rechtstreeks in het communicator-toestelletje dat ieder crewlid op zijn borst droeg.

Lange weg

Die droom om de universele vertaler naar huidige consumententechnologie te brengen bestaat al minstens tien jaar, en de technologie heeft al een hele weg afgelegd. Maar ook na de cruciale doorbraak van Large Language Models (LLM’s) in 2022 zijn we er nog lang niet. Wereldwijde tests van de eerder beschreven oortjes met vertaalfunctie zijn overwegend positief, maar ze doen dan ook wat techreviews doen: de plusjes en de minnetjes van het huidige product tegenover elkaar zetten, terwijl ze zelden de vraag beantwoorden of de technologie überhaupt al klaar is voor dagelijks gebruik.

Waarop het antwoord, zo blijkt ook tussen de lijnen in hun bevindingen, overwegend negatief zou zijn: in een test van de recentste vertaaloortjes van gespecialiseerde fabrikant Timekettle, op de IFA-beurs in september 2024, schreef TechRadar: Ik zou de vertalingen graag sneller zien komen, voor een meer natuurlijke flow.” En Wired, in een iets recentere review van de Vasco Translator E1: “Zoals met alle live vertaaltools moet je redelijk langzaam praten, elke zin of twee een pauze nemen en woorden zo duidelijk mogelijk uitspreken.”

Ai Robot Hand holding speech bubble with arrows and text in many important languages. World map background. Translator and languages education with Artificial Intelligence concept.

Euvels weggehakt

Voor een doorbraak naar primetime moet de technologie dus nog heel wat euvels overwinnen. Taalmodellen hebben gedurende de afgelopen jaren al een opmerkelijke groei laten zien, maar het is toch nog iets anders om verbale communicatie simultaan te vertalen: daarvoor is de latentie van de oortjes nog wat te groot (de meeste reviews hebben het over een gat van 2,5 seconden tijd om de spraak te interpreteren), en in de meeste gevallen zit er ook nog een smartphone in het proces. Bovendien zijn er nog kosten aan de nauwkeurigheid. Accenten, dialecten, straattaal, jargon, meer dan twee sprekers: allemaal dingen die de accurate vertaling nog in de weg zit.

Maar de enige echte technologische belemmering zit in de achterliggende taalmodellen, en nogmaals: die evolutie is nog altijd in sneltreinvaart bezig. Gespecialiseerde fabrikanten hakken ook stilaan de bekende tekortkomingen weg. Timekettle, in 2016 opgericht met de bedoeling om ooit een technologie te presenteren die in de buurt komt van Douglas Adams’ Babel Fish, lijkt daar momenteel het verste in te staan. Babel OS, de software die het Chinese bedrijf onlangs nog presenteerde, probeert bijvoorbeeld wat aan snelheid en accuratesse te winnen via segmentatie: uitgesproken zinnen worden in stukken gedeeld, waarna afzonderlijke algoritmes zich dieper over de inhoud van die zinsdelen buigen. Timekettle experimenteert ook met voice cloning-technologie, waardoor de vertalingen die de oortelefoons in het oor van de drager blazen de stem van de spreker benaderen.

We onderschatten bovendien hoe technologie – met al zijn huidige mankementen – al een hele tijd taalbarrières doorbreekt. Een beetje slimme toerist vertaalt bijvoorbeeld al een dik decennium lang naamborden in een vreemde taal via de camera van zijn smartphone: de Google Translate-app kan dat. Captain Kirk zou die technologie, meer dan tweehonderd jaar in de toekomst, alvast graag in zijn tengels hebben.

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content