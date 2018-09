Google Translate, de vertaaldienst van de gelijknamige techgigant, wordt dagelijks door meer dan 200 miljoen mensen gebruikt. Maar de resultaten van dat vertaalwerk zijn niet representatief wanneer het om geslacht gaat. Dat staat in een onderzoeksrapport van de Federale Universiteit van Rio Grande do Sul. Voor het onderzoek bekeken drie onderzoekers, Marcelo Prates, Pedro Avelar, en Luis Lamb, hoe Google Translate zinnen vertaalt vanuit een twaalftal gender-neutrale talen.

In die talen, waaronder Chinees, Hongaars, Japans en Turks, wordt meestal geen onderscheid gemaakt tussen 'hij' of 'zij'. Wanneer Google Translate die zinnen omzet in het Engels, moet het algoritme dus zelf het geslacht van het onderwerp invullen.

Is de ingenieur een hij of een zij?

De onderzoekers maakten zo zinnen als 'Hij/zij is een ingenieur' en stuurden die vervolgens door Google Translate, om te zien op welke manier de dienst zelf de persoonlijke voornaamwoorden invulde. Ze vergeleken de resultaten vervolgens met gegevens van het US Bureau of Labor Statistics (BLS) om te zien of de hoeveelheid mannelijke en vrouwelijke voornaamwoorden die Google zo genereert, overeenkomen met de werkelijkheid.

Volgens de onderzoekers zou het algoritme dit soort zinnen moeten genereren aan een ratio die min of meer representatief is voor de ratio in de buitenwereld. Het machine learning algoritme gebruikt namelijk gegevens uit die echte wereld. Wanneer een bepaald beroep voornamelijk door vrouwen wordt uitgeoefend, dan is het logisch dat Google Translate vaker 'zij' in een vertaalde zin rond dat beroep dropt. Dat is alvast de theorie, maar zo werkt het in de praktijk niet.

Mannelijke defaults

"We tonen aan dat Google Translate een sterke voorkeur vertoont naar mannelijke defaults, vooral in sectoren waar de genderbalans oneven is, zoals in STEM jobs", zo schrijven de onderzoekers. "We vergeleken deze gegevens met de data uit BLS voor de eigenlijke participatie van vrouwen in elk beroep, en tonen aan dat Google Translate niet in staat is om een distributie van vrouwelijke beoefenaars te tonen die gelijk loopt met die van de echte wereld."

In cijfertjes betekent dat dat Google Translate gemiddeld zo'n 11,76 procent van de zinnen met een vrouwelijk persoonlijk voornaamwoord vertaalde, over alle beroepen heen, terwijl volgens BLS vrouwen 35,94 procent van de werknemers in die beroepen uitmaken. Met andere woorden: Google Translate heeft een stevige voorkeur voor mannen in zinnen over beroepen, eentje die bovendien niet overeen komt met de werkelijkheid.

Stereotypen

De stereotypen gaan trouwens in twee richtingen. De voorkeur van het algoritme voor woorden als 'aantrekkelijk', 'gelukkig' of 'lief' ging duidelijk uit naar vrouwelijke voornaamwoorden, terwijl zinnen met woorden als 'arrogant', 'schuldig' en 'gemeen' dan weer vaker als mannelijk werden vertaald.

De vooroordelen van Google Translate in het Engels zijn zorgwekkend, schrijven de onderzoekers nog, omdat die taal meestal als basis wordt gebruikt. Een zin van Swahili naar Chinees vertalen, zal meestal een bruggetje maken over Engels. "Google Translate gebruikt Engels meestal als 'lingua franca' om te vertalen tussen andere talen", aldus de paper.