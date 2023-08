De techgigant stelt een AI-model voor dat ontworpen is om gesproken en geschreven taal te verwerken en vertalen. Het krijgt de naam SeamlessM4T mee.

Het gaat om een machine learning model dat automatisch spraak kan herkennen uit tekst of gesproken audio, en die kan vertalen. Het model kan gesproken audio automatisch neerpennen, of ze meteen ook omzetten in een andere taal.

Het bedrijf focust zich dan ook op het multimodale model, dat verschillende taken op kan nemen. ‘Het bouwen van een universele vertaler, zoals de fictieve Babel Fish uit The Hitchhiker’s Guide tot he Galaxy, is moeilijk omdat bestaande spraak-naar-spraak en spraak-naar-tekst systemen alleen een fractie van de huidige wereldtalen kunnen verwerken’, aldus Meta in een blogpost. ‘We geloven wel dat we vandaag een belangrijke stap in deze richting hebben genomen.’

Machine learning

SeamlessM4T volgt op eerdere taalmodellen van Meta, waaronder No Language Left Behind. De vertaler kan volgens de techgigant 101 talen verwerken via spraakinput, en 96 talen voor tekst input en output. Het model kan 35 talen als spraakoutput bieden.

Recente vooruitgang in machine learning betekent echter dat vertaalsoftware in een stroomversnelling lijkt te komen. Google kondigde op zijn recente IO ontwikkelaarsconferentie bijvoorbeeld al een universele vertaler aan die automatisch video zou kunnen dubben.