Alles wat de mens in de toekomst ooit nog zal ondernemen, zal steunen op data. Dat stelt Arcitecta, niet toevallig een bedrijf dat een oplossing biedt om die data te beheren op (heel) grote schaal.
Data News ontmoette Arcitecta twee jaar geleden voor het eerst tijdens een bezoek aan het hoofdkwartier van Spectra Logic in Colorado, een bedrijf dat bekendstaat om zijn opslagoplossingen met grote tape libraries. Onlangs reisde directeur productmarketing Eric Polet naar New York, voor een update rond Arcitecta, in het kader van de IT Press Tour. Bedrijven helpen om zo veel mogelijk waarde uit hun data te halen, dat blijft de doelstelling van Arcitecta. Het doet dat onder meer door in te zetten op lagere kosten, snellere resultaten en een betere vindbaarheid, toegankelijkheid en herbruikbaarheid van data.
‘We zijn in wezen een databasebedrijf’, zegt Eric Polet. ‘We ontwikkelen onze eigen databasetechnologie en onze eigen software voor datamanagement. Maar dat maakt van ons uiteindelijk vooral ook een databedrijf. Het gaat om meer dan enkel onderdak bieden aan data, het gaat om de dingen die je met data kunt doen.’ Arcitecta zet daarvoor Mediaflux in, een oplossing die – eenvoudig gesteld – de dataopslag virtualiseert. ‘En zo virtualiseren we ook AI’, klinkt het, ‘want AI kan niet bestaan zonder data.’ Klanten van Arcitecta zijn onder meer Princeton University, MIT en het nationale film- en klankarchief van Australië: stuk voor stuk organisaties die gigantische datavolumes beheren.
Datagroei houdt aan
Het voorbije jaar vond Arcitecta een manier om de densiteit van de data in zijn database minstens te verdubbelen. Maar dan nog blijft het beheer van data op grote schaal een complex probleem. ‘Schuiven met honderden petabytes aan data doe je niet zomaar’, zegt Polet. ‘Bedrijven onderschatten dat vaak.’ Tegelijk maakt Arcitecta zich sterk dat het ondersteuning biedt voor een triljoen files – duizend miljard – binnen één enkele namespace. Het bedrijf beantwoordt daarmee aan de eisen van de markt, zegt het. ‘De exponentiële datagroei is zeker nog niet voorbij.’
‘De exponentiële datagroei is nog niet voorbij’
Dat de datavolumes almaar verder toenemen, plaatst ons in de toekomst onvermijdelijk voor een bijkomende uitdaging. ‘Het gaat dan niet alleen om de complexiteit van het beheer van die enorme volumes, maar ook om dat beheer op zich fysiek mogelijk te maken. In de toekomst zal de benodigde rekenkracht draaien op de locaties waar er energie en water beschikbaar is. We zullen de data dus naar de rekenkracht moeten brengen, het omgekeerde van wat vandaag gebeurt.’
Bewust omgaan met data
Zelfs in de huidige context – waarbij de doorbraak van generatieve AI en de opkomst van AI-agents het belang van data alleen maar onderstreept – ziet Arcitecta dat er net op het vlak van databeheer nog veel werk te doen blijft. ‘Als je een bedrijf vraagt hoeveel data het heeft, dan komt er heel vaak geen antwoord’, zegt Eric Polet. ‘Welke types data? Opnieuw: geen antwoord! Dat is ronduit shokerend, zeker als je op dat moment een datamanager voor je hebt.’
Andere organisaties lopen dan weer voorop, met name wanneer data geldt als de primaire grondstof voor hun activiteiten. ‘Onderzoekers aan Princeton, bijvoorbeeld, willen ook in de verre toekomst data kunnen opzoeken, terugvinden en gebruiken. Zij hebben letterlijk een databeleid voor de komende honderd jaar.’ Opvallend is dat Arcitecta zijn klanten aanstuurt om heel bewust met data om te gaan. Voor het gebruik van Mediaflux betaal je op basis van het aantal gebruikers, niet het datavolume. ‘Het is ons niet om het volume te doen’, zegt Eric Polet. ‘We willen datacuratoren ondersteunen, geen data hoarders.’