Terwijl bedrijven investeren in generatieve AI, stuiten projecten vaak op een onverwachte barrière: inefficiënte infrastructuur. Volumez wil dat probleem oplossen met een nieuwe benadering van cloudopslag en databeheer.

Twee jaar na zijn intrede in de markt introduceert Volumez een oplossing die GPU-efficiëntie maximaliseert en AI/ML-datapipelines automatiseert. Het bedrijf profileert zich daarmee als een pionier op het vlak van Data Infrastructure as a Service (DIaaS). Data News nam de stand van zaken bij Volumez op in de kantoren van Samsung in Mountain View, Californië, in het kader van de IT Press Tour. Samsung Venture Investment is één van de bedrijven die in Volumez gelooft.

De start-up stelt vast hoe AI op korte tijd uitgroeit tot een essentiële hoeksteen van zowat elke moderne bedrijfsstrategie. Met name de adoptie van GenAI verloopt razendsnel. Waar in 2023 slechts 5% van de bedrijven GenAI gebruikte, stijgt dat volgens IDC naar 80% in 2026. Maar er is een uitdaging: slechts 10% van de AI-projecten haalt vandaag effectief de productiefase, aldus Forbes. De reden? Inefficiënte infrastructuur. Bedrijven kampen met I/O-bottlenecks, onderbenutte GPU’s, hoge kosten en gefragmenteerde workflows die innovatie vertragen.

As a service

Dat kan beter, stelt Volumez, via Data Infrastructure as a Service. ‘Door een slimme analyse te maken van de gebruikte cloudcomponenten en een dynamische IaaS-catalogus tot stand te brengen, zorgen we voor een balans tussen de computeropslag en het netwerk, op maat van het aantal I/O-operaties per seconde (IOPS)’, zegt John Blumenthal, Chief Product & Business Officer bij Volumez.

‘Als je je GPU maar voor 50% gebruikt, betaal je eigenlijk twee keer te veel’

Het bedrijf biedt de oplossing aan via een controllerloze architectuur, wat de latency extreem laag houdt. ‘Geen extra schakels, geen obstakels’, zo klinkt het. Uit een eigen performantietest kwam Volumez alvast uit de bus als sneller en goedkoper dan de concurrentie. ‘Het prijsverschil loopt op tot 202 procent in vergelijking met andere oplossingen, puur op basis van prijs per throughput’, stelt Blumenthal. En minstens even belangrijk: het beheer loopt uitsluitend via Infrastructure as Code. ‘Zo behouden bedrijven de volledige controle over hun infrastructuur, zonder dat ze zelf complexe configuraties moeten beheren.’

Optimaal beschikbare rekenkracht benutten

Die efficiëntie is van groot belang bij de training van AI-modellen, waar onbenutte GPU’s vaak een groot probleem vormen. Volumez claimt die uitdaging volledig op te lossen. ‘Dat maakt het verschil’, zegt dr. Eli David, AI-onderzoeker en expert in GPU-optimalisatie van de universiteit van Bar-Ilan in Israël. ‘Als je je GPU maar voor 50% gebruikt, betaal je eigenlijk twee keer te veel.’

In die optiek tempert Eli David de commotie die er heerste rond Deepseek, net toen de IT Press Tour bij Volumez op bezoek was. ‘Het toont vooral aan hoezeer we AI-modellen nog verder moeten optimaliseren en versnellen.’ Hij schetst een toekomst waarin LLM’s niet langer dezelfde zware infrastructuur nodig hebben als vandaag. ‘Toen systemen ooit 16.000 CPU’s nodig hadden om een kat te herkennen op een foto, leek dat indrukwekkend. Maar de snelheid waarmee we modellen tegenwoordig trainen, zal alleen maar toenemen.’

Verder blijven bouwen

Over welke bedrijven al concreet met DIaaS aan de slag zijn, blijft Volumez vaag. Onder meer Fujitsu Research of Europe, een R&D-poot van de Japanse elektronicaproducent, bestudeert hoe de oplossing van Volumez zijn infrastructuur efficiënter kan maken. Volumez zelf haalde intussen vers kapitaal op om zijn technologie verder uit te bouwen. De teller staat nu op 40 miljoen dollar.