Met Dolly 2.0 gaan ChatGPT-achtige taalmodellen openbron

© Getty
Els Bellens
Els Bellens Technologiejournaliste bij Data News

Amerikaans softwarebedrijf Databricks heeft Dolly 2.0 uitgebracht. Het zou gaan om het eerste openbron taalmodel voor commercieel gebruik en kan de basis vormen voor gratis of open source concurrenten van chatbots als ChatGPT.

Dolly 2.0 is een tekstgenerator, een ‘large language model’ (llm) dat chatbots kan aansturen en tekst kan samenvatten of zoekopdrachten uitvoeren. Qua functie lijkt ze dus sterk op andere llm’s die de voorbije maanden zijn uitgekomen of aangekondigd, waarvan ChatGPT waarschijnlijk de bekendste is. Speciaal hier is echter dat Dolly 2.0 openbron is, en dat onafhankelijke ontwikkelaars en bedrijven een gratis licentie op de dienst kunnen nemen om het in commerciële producten in te bouwen.

De AI is een vervolg op de eerste Dolly, die in maart dit jaar uitkwam. Het bedrijf achter de llm is Databricks, een enterprise softwarebedrijf dat zich gespecialiseerd heeft in Apache Sparks. ‘We willen meer open en transparante taalmodellen op de markt omdat we willen dat bedrijven met AI hun eigen chatbots en apps kunnen bouwen, trainen en bezitten, op basis van hun eigen datasets’, zegt Ali Ghodsi, CEO van Databricks, aan techsite TechCrunch.

Geen restricties

Opvallend is dus dat Dolly 2.0 het eerste generatieve AI-model is dat zonder restricties op de markt wordt gebracht. Bedrijven die met ChatGPT willen werken, bijvoorbeeld, betalen voor de API en gaan vaak ook data moeten delen. Met een openbronmodel moet het systeem voor meer bedrijven bruikbaar worden.

Dat gezegd zijnde, lijkt Dolly 2.0 niet alleen gelijkaardige voordelen, maar ook nadelen te hebben die andere llm’s tonen. Zo zou het algoritme vooral Engels spreken, en heeft ze de neiging feiten te verzinnen. Ook zou ze soms kwetsend uit de hoek kunnen komen. Dat zijn problemen waar ook andere taalmodellen mee te maken hebben.

De ontwikkeling van generatieve AI is de laatste maanden in een stroomversnelling terechtgekomen, met meerdere techgiganten die zich op de markt proberen te positioneren. De taalmodellen krijgen echter ook tegenkanting. Zo zijn er vragen over de bronnen waarop deze modellen zijn getraind, en of de makers van die data daar toestemming voor hebben gegeven. Internationale experts hebben ook een petitie opgestart waarin ze vragen de ontwikkeling een tijdlang te pauzeren. Zij maken zich onder meer zorgen over de economische gevolgen, en de gevaren voor grootschalige desinformatie als deze chatbots ons internet overspoelen.

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content