Komprise: gevoelige gegevens opsporen voor betere AI-governance

© Getty Images
Dries Van Damme

Natuurlijk wil je niet dat gevoelige data via een AI-toepassing je bedrijf verlaten en zo onbewust en ongewild in de verkeerde handen terechtkomen. Daarom voegt Komprise nieuwe detectiemogelijkheden toe aan zijn oplossing voor het beheer van ongestructureerde data.

De creatie en het gebruik van ongestructureerde data blijven explosief toenemen. Daardoor stijgt ook het risico dat gevoelige gegevens opduiken op plaatsen waar ze niet thuishoren. Generatieve AI vergroot dat risico. Vandaag vertegenwoordigen pogingen om persoonlijk identificeerbare informatie (PII) op GenAI-platformen in te voeren al meer dan de helft (55%) van alle security events die zich voordoen in het kader van de preventie van gegevensverlies. Daarna volgt het invoeren van vertrouwelijke documenten (40%) in GenAI-toepassingen, zo blijkt uit onderzoek van Menlo Security.

Aan die incidenten zijn ook kosten verbonden. Zo bereikte de gemiddelde kost van een datalek vorig jaar al bijna de kaap van de vijf miljoen dollar, volgens IBM. Maar hoewel opslagbeheerders steeds vaker (mee) verantwoordelijk zijn voor data governance en de naleving van de regelgeving inzake databeheer, ontberen zij nog te vaak de middelen om daar systematisch werk van te maken binnen de eigen dataomgeving.

Smart Data Workflow Manager

Als specialist in het beheer van ongestructureerde data wil Komprise daar met zijn Smart Data Workflow Manager verandering in brengen. De softwareleverancier, die zich graag ook positioneert als data-engine voor AI, pakt het probleem direct bij de bron aan: de ‘ingestion’ van ongestructureerde data die nodig is om de knowledge bases op te bouwen waarop generatieve AI-toepassingen gebaseerd zijn.

‘Voor AI heb je nu eenmaal data nodig’, aldus CEO Kumar Goswami, tijdens een presentatie die Data News volgde in het hoofdkwartier van Komprise in Campbell, Silicon Valley, in het kader van de IT Press Tour. ‘Het gaat om héél veel data, die ook nog eens naar de cloud moeten. Alleen wil je niet dat daar ook gevoelige data bij zitten die via dat innameproces het bedrijf verlaten en zo complianceproblemen veroorzaken. Heel vaak zijn bedrijven zich daar niet eens van bewust.’

Een naald in een hooiberg

Maar zelfs als ze er zich van bewust zijn, blijft het in de praktijk meestal zoeken naar een naald in een hooiberg. ‘Een klant van ons had honderdduizend bestanden die hij wou gebruiken voor AI-doeleinden’, vertelt Kumar Goswami. ‘Daar bleken uiteindelijk dertien bestanden bij te zitten die daar niet bij mochten zitten. Manueel had die klant de bestanden in kwestie nooit kunnen vinden, dat spreekt voor zich. Of toch niet binnen een redelijke termijn.’ Via de detectiemogelijkheden van Komprise, lukte dat wel.

Artificiële intelligentie biedt zelf overigens ook best wat mogelijkheden om dat detectieproces te verbeteren en te versnellen. Dat toont het verhaal van de Duquesne Universiteit in Pittsburgh (Pennsylvania). ‘John F. Kennedy bezocht die universiteit vroeger vaak’, vertelt Goswami. ‘De universiteit had het idee om een tentoonstelling samen te stellen met foto’s uit die tijd. Alleen bleek het archief drie miljoen foto’s te bevatten. Daar manueel de juiste foto’s uitpikken, ging onmogelijk lang duren. Maar met behulp van AI wist de universiteit dat aantal tot tienduizend potentieel interessante foto’s terug te brengen. Daarvan waren er bovendien al negen getagd waar JFK opstond. In minder dan twee uur tijd was het hele zoekproces rond. En omdat het hier om een herhaalbare oefening gaat die ook nog eens gepaard gaat met een leerproces, zal die de volgende keer waarschijnlijk zelfs maar een paar minuten in beslag nemen.’

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content