BREIN haalt opnieuw groot taalmodel offline

Ziggo hoeft waarschuwingsbrieven Brein niet door te sturen
Matthieu Van Steenkiste Freelance medewerker Data News

De Nederlandse Stichting BREIN heeft een week na het gelijkaardige GEITje-7B opnieuw een Nederlands AI-taalmodel offline gehaald. Het kon niet aantonen op legitieme wijze te zijn getraind.

Het gaat opnieuw om een op Mistral-7B gebaseerd model dat volgens zijn maker onder andere getraind was op vele miljarden tokens aan Nederlandstalige literatuur, nieuws en studieboeken. Verder gaf hij geen toelichting welke specifieke materialen dat waren, maar met zoveel data was het zeer onwaarschijnlijk dat het uitsluitend zou gaan om rechtenvrije materialen. De AI werd primair aangeboden als chatbot en kon door iedereen gedownload en gedraaid worden.

BREIN vroeg de maker wat die trainingsdata zijn, waar deze data vandaan komen en of de maker wel een licentie had om ze op die manier te verzamelen en te verwerken. Als de rechten om dat te doen zouden ontbreken, moest het model offline. De modelmaker voelde de bui al hangen en besloot zonder verdere inhoudelijke discussie zijn taalmodel offline te halen.

‘Niet tegen AI’

Datasets voor het trainen van AI worden wel vaker gevuld met materialen uit illegale bron. De namen van een aantal zogenaamde shadow libraries komen vaker langs in deze context. ‘Wij zijn niet tegen AI en de training daarvan, maar voor het gebruik van boeken, nieuwsberichten, muziek etc. voor AI-doeleinden moet toestemming zijn en er moet logischerwijs een vergoeding tegenover staan’, zegt de auteursrechtenorganisatie. ‘De AI aanbieders vragen zelf ook geld voor gebruik van hun modellen. Daarom kan het alleen maar ten koste gaan van de inkomsten van auteurs en boeken- en nieuwsuitgevers als hun producties zonder vergoeding gebruikt worden om een taalmodel te maken.’

In de Verenigde Staten zijn al tientallen rechtszaken aanhangig tegen aanbieders van AI modellen. In Europa komen nu ook de eerste zaken voor de rechter. Gaandeweg beginnen de eerste licentieafspraken gemaakt te worden, bijvoorbeeld tussen OpenAI en de Financial Times en recentelijk ook de voorlopige afspraak tussen de grote muziekmaatschappijen en Anthropic.

‘Uiteindelijk gaat het erom dat ook de tech-industrie zich aan de wet houdt en auteursrechten respecteert. Makers en producenten moeten een eerlijke boterham kunnen verdienen en (big) tech moet voor het gebruik van materiaal van anderen gewoon betalen, net zoals ieder ander’, besluit BREIN-directeur Bastiaan van Ramshorst.

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content