Nieuwe Dall-E-versie wordt vooral versterkt door ChatGPT

Beeld gegenereerd door Dall-E 3. © OpenAI

Ronald Meeus Freelance journalist

Freelance journalist 22-09-2023, 10:05 Bijgewerkt op: 22-09-2023, 10:05 2 min leestijd

De derde versie van AI-beeldgenerator Dall-E is niet alleen wat verscherpt in de output die hij creëert, maar ook de prompts zullen veel complexer kunnen. Daarvoor hoefde ontwekkelaar OpenAI natuurlijk ver te zoeken: Dall-E 3 is vanaf nu powered by het eigen ChatGPT.

Met de publieke doorbraak van generatieve AI is ook ons technische vocabularium zich snel aan het uitbreiden. Prompt engineering, bijvoorbeeld, is een term die we stilaan allemaal leren kennen: het opstellen van een geraffineerde ‘prompt’, de opdracht die de gebruiker doortikt aan de AI, wordt stilaan bijna een métier op zich. En dat lijkt het team achter Dall-E, bij kersverse Silicon Valley-coryfee OpenAI, ook door te hebben.

Versie 3 van de AI-beeldgenerator kan zo, verscherpt door ChatGPT, veel gedetailleerdere en complexere vragen aan, en kan nu ook constant nieuwe versies maken gebaseerd op de conversationele interface van ChatGPT. Het is alsof de gebruiker een tekenaar tijdens het proces vraagt om veranderingen door te voeren. ‘Je hoeft je niet echt zorgen te maken over gedoe met zeer lange prompts’, zegt Aditya Ramesh, hoofd van het Dall-E-team, tegen Wired. ‘In plaats daarvan kun je gewoon communiceren met ChatGPT alsof je tegen een collega praat.’

Geen voze output

De derde versie van Dall-E – de naam is, voor wie dat nog niet wist, een portmanteau van kunstenaar Salvador Dalí en Pixar-personage Wall-E – bevat natuurlijk ook een resem tweaks aan het algoritme. Dat gaat nog steeds op zoek naar grote hoeveelheden beelden die op het internet te vinden zijn, en voorspelt op basis daarvan hoe een beeld met bepaalde aangegeven elementen moet worden ‘gerenderd’. Het blinkt nu bijvoorbeeld wat meer uit in verhoudingen tussen objecten, en is wat scherper in details als handen en reflecties.

Verder werden er striktere filters gezet op de content die met de beeldgenerator kan worden gemaakt. Het is nu moeilijker om gewelddadige, haatdragende of – euh – ‘volwassen’ afbeeldingen te genereren. Ook werd er bij OpenAI een ‘red team’ losgelaten op het algoritme om ervoor te zorgen dat de beeldgenerator bevolkingsgroepen in het plaatje minder over- of onderrepresenteert.

Beschermende maatregelen

Nog meer verscherpingen: er kunnen geen prompts worden opgegeven rondom publieke figuren. Dit om, met de steeds krachtiger wordende beeldgenerator, het risico op propaganda en desinformatie tegen te gaan. En het aantal maatregelen waarmee kunstenaars hun originele werk kunnen beschermen werd uitgebreid. Dall-E 3 weigert prompts waarbij afbeeldingen worden gemaakt in de stijl van nog levende kunstenaars. Artiesten kunnen ook actief aangeven dat ze niet willen dat het algoritme op hun werk wordt getraind.

Dall-E 3 wordt ergens in het vierde kwartaal van dit jaar beschikbaar voor het brede publiek.

Lees meer over: