Reddit zou een deal hebben om AI te trainen op zijn content
Reddit heeft een overeenkomst gesloten met een ‘onbenoemd groot AI-bedrijf’, dat schrijft Bloomberg. Het bedrijf zou daarmee toegang krijgen tot de gigantische hoeveelheid aan teksten en postjes van het forum.
De overeenkomst zou zo’n 60 miljoen dollar waard zijn, schrijft Bloomberg nog. Reddit is een van de grootste webfora op het huidige internet en heeft dus een grote hoeveelheid aan door gebruikers geschreven content. Dat is een potentiële goudmijn aan data om een AI op te trainen.
Dat een gelijkaardige deal er zat aan te komen, was al een tijdje te voorspellen. In juni van vorig jaar begon Reddit zijn tot dan toe open API dicht te timmeren, met gevolgen voor apps van derde partijen. Dat leidde ook lange tijd tot gebruikersprotest. Nu zou Reddit dus een betalende klant hebben gevonden voor zijn data.
Veel van de huidige AI-modellen zijn getraind op data waarvoor geen toestemming werd gegeven, maar door een reeks rechtszaken over auteursrecht begint daar verandering in te komen. OpenAI, maar ook Apple, zouden bijvoorbeeld al afspraken gemaakt hebben met nieuwsuitgevers om hun artikels te gebruiken als trainingsdata.
Fout opgemerkt of meer nieuws? Meld het hier