Meer doen met data dankzij generatieve AI

SAS

Partner Content

8 september 2022, 11:56 Bijgewerkt op: 24 november 2022, 15:31

Data zijn heel vaak gelinkt aan mensen. Daarom zorgt onder meer de GDPR ervoor dat we met die data niet zomaar om het even wat mogen doen. Generatieve AI omzeilt die drempel. De technologie genereert synthetische data, waarmee je met veel minder voorbehoud aan de slag kan.

Generatieve AI is een vrij nieuwe discipline. Eenvoudig gesteld gaat het om AI die er op basis van echte – ‘originele’ – data in slaagt om nieuwe, synthetische data te genereren. Die synthetische data hebben alle kenmerken van echte data. Ze weerspiegelen de realiteit, maar zijn tegelijk niet een-op-een gelinkt aan iets dat echt is.

De technologie steunt op deep learning. In wezen gaat het om een algoritme met twee componenten. Een eerste component neemt bestaande, originele data als uitgangspunt en genereert daarmee nieuwe, synthetische data. De tweede component achterhaalt het onderscheid tussen echte en synthetische data, wat de eerste component toelaat om de kwaliteit van de synthetische data almaar verder op te voeren – tot ze niet meer van echte data te onderscheiden zijn.

Mensen die niet bestaan

“Generatieve AI slaagt er bijvoorbeeld in om beelden te creëren van mensen die niet bestaan”, zegt Véronique Van Vlasselaer, Analytics & AI Lead bij SAS Institute. “Aan de bron liggen echte foto’s – originele data – maar het resultaat bestaat puur uit synthetische data.” Het grote voordeel: iemand die niet bestaat, kan geen bezwaar hebben tegen het gebruik van een foto.

“Met echte data moet je heel omzichtig omgaan”, legt Véronique Van Vlasselaer uit. “De GDPR beschermt de privacy van de dataverschaffers.” Bij synthetische data vallen die restricties weg, wat onder meer onderzoekers meer mogelijkheden biedt. “Wanneer je samen met een partner een traject rond data analytics opzet, kun je originele data niet zomaar delen. Wanneer je er eerst synthetische data van maakt, mag het wel. De partner kan de data vervolgens verrijken en zo nieuwe inzichten creëren.” In het kader van sommige regulering mogen originele data een bepaald grondgebied niet verlaten. Ook dat kun je opvangen door er eerst synthetische data van te maken.

Synthetische data kunnen verder een oplossing bieden voor een gebrek aan beschikbare originele data. “Ik denk bijvoorbeeld aan onderzoek in de gezondheidszorg. Soms zijn er gewoonweg onvoldoende originele data beschikbaar. Generatieve AI laat toe een grotere datapoule te creëren.” Op dezelfde manier werkt generatieve AI de ondervertegenwoordiging van minderheidsgroepen in een dataset weg, via de toevoeging van synthetische data.

Véronique Van Vlasselaer, Analytics & AI Lead bij SAS Institute: “Generatieve AI en synthetische data bieden een opportuniteit aan sectoren die door de GDPR beperkt zijn in wat ze met data mogen doen.”

Van wetenschappelijk onderzoek tot deepfakes

Het toepassingsgebied voor generatieve AI is heel ruim. “Het gaat in de eerste plaats om sectoren die door de GDPR beperkt zijn in wat ze met bijvoorbeeld consumentendata of gezondheidsdata kunnen en mogen doen”, zegt Véronique Van Vlasselaer. “Een ander voorbeeld is dat van de financiële sector, waar weinig data beschikbaar zijn over fraude. Generatieve AI kan voor ruimere datasets zorgen, wat nuttig is in de zoektocht naar oplossingen voor fraudedetectie.”

Generatieve AI laat de filmindustrie toe om bijvoorbeeld op een heel realistische manier de jongere of oudere versie van een acteur te creëren. Maar evengoed is het de technologie die deepfakes mogelijk maakt, bedoeld om desinformatie te verspreiden of te frauderen. “Als je twijfelt of een foto of video echt is, zijn er specifieke elementen waar je op kunt letten”, zegt Véronique Van Vlasselaer. “AI heeft het onder meer moeilijk met pupillen en met de symmetrie van ogen, oren of oorlellen. Vaak bevat een ‘synthetische’ foto ook maar één persoon en ziet de achtergrond er niet echt realistisch uit.”

Meer doen met data dankzij generatieve AI

Wetgeving moet mee evolueren

Generatieve AI lijkt in de eerste plaats een oplossing om de beperkingen rond het behandelen en bewerken van data in het kader van de GDPR te omzeilen. “Generatieve AI maakt meer mogelijk rond het delen van data en inzichten uit data”, aldus Véronique Van Vlasselaer. “Het is ook minder erg wanneer synthetische data uitlekken, bijvoorbeeld.”

Toch is de GDPR in het kader van generatieve AI niet helemaal van de baan. Originele data liggen aan de bron van de synthetische data. Het wetgevende kader zal mee moeten evolueren met wat generatieve AI mogelijk maakt. “Het gebruik van generatieve AI in een puur zakelijke context begint op gang te komen”, besluit Véronique Van Vlasselaer. “Maar op zich is de technologie nog heel jong. Het zal nog wel een tijdje duren voor we de eerste echte concrete bedrijfstoepassingen zien.”

Beluister hieronder de volledige podcast:

Meer info op www.sas.com/belux