Amazon werkt aan deepfake stemmen voor Alexa
Alexa, de slimme assistent van Amazon zou een functie kunnen krijgen waarbij ze de stem van een mens kan imiteren op basis van een minuut audio.
Amazon zegt aan de functie te werken waarbij Alexa iemands stem kan imiteren op basis van een minuut audio. Het bedrijf kondigt dat aan op zijn re:MARS-conferentie in Las Vegas in de Verenigde Staten. De technologie wordt verpakt als een mogelijkheid om herinneringen op te halen aan dierbare overledenen door teksten in hun stem te laten voorlezen.
Nog afgezien van de psychologische consequenties van dat idee, en ethische vragen over de rechten op iemand zijn stem, heeft technologie die snel en makkelijk iemand zijn stem kan ‘deepfaken’ natuurlijk nog andere mogelijke gevolgen. Zo zou ze kunnen worden gebruikt voor frauduleuze doeleinden zoals phishing via voice (‘vishing’). Denk daarbij bijvoorbeeld aan een telefoontje van de ‘CFO’ die vraagt om stante pede geld een specifieke rekening (aan de fraudeurs) te betalen.
Het gaat voor alle duidelijkheid om een demo van een mogelijk toekomstige technologie. Computersystemen kunnen nu al stemmen imiteren, maar hebben daar momenteel nog veel meer input voor nodig dan een minuut geluid.
Amazon toonde de functie in een filmpje waarin een kind vraagt om een verhaaltje te horen dat wordt ‘voorgelezen’ door oma. Het is niet duidelijk hoever de ontwikkeling van de functie al gevorderd is. De demo lijkt gebaseerd op vorderingen in tekst-to-speech technologie van Amazon, zoals uitgelegd in deze white paper.
Fout opgemerkt of meer nieuws? Meld het hier