Vincent Oostlander

‘Zonder voldoende dataopslag kunnen we AI niet meer vertrouwen’

Vincent Oostlander Director EMEA Solution Sales bij Seagate.

Kan de dataopslagcapaciteit in onze wereld uitgeput raken? In het slechtste geval: ja. Het is zeker een risico waar bedrijven rekening mee moeten houden. Het heeft veertig jaar geduurd om de opslaginfrastructuur uit te bouwen waar we vandaag over beschikken, maar in de komende vier jaar moeten we deze capaciteit verdubbelen. Om scenario’s te voorkomen waarbij bedrijven hun kostbare data moeten verwijderen, is het cruciaal om dataopslag op lange termijn te bekijken.

In 2024 gebruikten we wereldwijd voor 7 ZB (zettabyte) aan opslag. In 2028 gaan we ongeveer 14 ZB aan opslag nodig hebben. Die explosie aan data wordt één van de grootste uitdagingen waar we voor staan. We hebben nood aan meer, en vooral slimmere opslagoplossingen.

De grootste drijfveer van deze dataexplosie is natuurlijk AI. Sommige IT-sectoren en industrieën zijn al vergevorderd met deze technologie en beseffen dan ook dat ze enorme hoeveelheden data genereren. Denk aan High-Performance Computing (HPC) en onderzoekscentra die data gebruiken om te leren en onderzoek te versnellen. Of aan bedrijven in fintech of farmaceutica met een R&D-center waar machine learning-modellen op basis van historische data steeds beter worden in het voorspellen van toekomstige gebeurtenissen. Zonder enorme hoeveelheden opslagcapaciteit zou dit niet mogelijk zijn.

Plannen op lange termijn

Bedrijven moeten anticiperen op de toekomst. Wie nu een beslissing neemt over de aankoop van een opslagsysteem, moet eigenlijk al nadenken over wat er binnen enkele maanden nodig zal zijn. Het is nu eenmaal niet mogelijk om een grootschalige opslagoplossing te bestellen en deze al meteen de volgende maand geleverd te krijgen. Grote projecten kunnen door de hoge vraag tot zo’n twaalf maanden levertijd hebben. Waar producenten van harde schijven vroeger een ruime stock hadden, wordt er nu vooral op basis van de behoefte van de klant geproduceerd. Als je dan weet dat het tot één jaar duurt om een harde schijf te maken, is denken op lange termijn de boodschap.

Opslag is geëvolueerd van een product naar een strategische troef voor bedrijven. We moeten organisaties hierover goed onderrichten – en dan vooral de System Integrators en cloudproviders die enorm veel opslagcapaciteit nodig hebben. Zij moeten in staat zijn om hun behoeften nauwkeuriger te voorspellen. Maar ook op kleinere schaal zien we dat die voorspelbaarheid van opslagcapaciteit een steeds belangrijkere factor is.

Hallucinaties en bias

De inzet is hoog, want opslag is essentieel voor de kwaliteit en de betrouwbaarheid van AI-applicaties. Als we op onze smartphone niet genoeg opslagruimte hebben, dan gaan we eerst proberen om overbodige bestanden te verwijderen. Vaak zijn dat oudere foto’s of documenten die we al een tijd niet meer gebruiken. Voor bedrijven is dat geen serieuze optie, vooral wanneer ze AI gebruiken. Ook ongebruikte data hebben nog steeds waarde. Wat vandaag eerder bijzaak lijkt, kan in de toekomst plots wel weer waarde krijgen, bijvoorbeeld als je een AI-systeem traint op basis van historische data.

Artificiële intelligentie genereert steeds meer data die moet worden opgeslagen. Op het eerste gezicht lijkt het logisch dat organisaties vooral nieuwe gegevens bewaren en dat oudere informatie moet sneuvelen. Maar daaronder vallen ook bronbestanden die in het kader van compliance vaak niet mogen verdwijnen. In sommige sectoren moet je immers kunnen aantonen waar bepaalde data vandaan komen. Of hoe AI tot een beslissing is gekomen. Je hebt controlepunten nodig om hallucinaties en bias op te lossen. Zonder een robuust opslagsysteem voor alle data, inclusief de bronbestanden, is AI niet meer dan een algoritme dat lukraak oplossingen aanreikt en uit de hand dreigt te lopen.

Meer capaciteit op één schijf

Een structureel tekort aan opslagcapaciteit vormt ook voor spelers als Facebook, Google en Amazon een bedreiging op lange termijn. E-commerce zou stilvallen, online transacties zouden mislukken en cloudplatformen dreigen onbruikbaar te worden — waardoor bedrijven mogelijk opnieuw zouden moeten terugvallen op eigen infrastructuur. Het is natuurlijk een extreem scenario, maar wel eentje waar we over moeten nadenken en waarop we moeten anticiperen. Enerzijds door betere planning aan de kant van de gebruiker, maar ook door het bouwen van slimmere oplossingen bij producenten.

Op dat vlak blijft de opslagtechnologie zich snel ontwikkelen, bijvoorbeeld met HAMR-technologie (Heat-Assisted Magnetic Recording). Dankzij geavanceerde technieken kunnen fabrikanten tegenwoordig aanzienlijk meer data op één harde schijf opslaan dan voorheen. Opslagcapaciteiten tot 36 TB zijn al beschikbaar, en 50 TB ligt binnen handbereik. Voor datacenters betekent dit dat ze meer data kunnen verwerken en opslaan binnen dezelfde fysieke ruimte. Deze evolutie is een gamechanger, vooral wat betreft betere kostenefficiëntie, minder energieverbruik en duurzaamheid.

Zeker in de Benelux en Europa zijn slimme dataopslagmogelijkheden cruciaal. Er is hier niet alleen minder fysieke ruimte voor datacenters dan in bijvoorbeeld de VS of China, maar ook de regelgeving en de energiebehoefte maken het niet gemakkelijk om nieuwe infrastructuur te bouwen. In 2019 besliste Amsterdam om die reden dat er geen datacenters mochten bijkomen. Vandaag reikt de stad wel opnieuw vergunningen uit, maar de voorwaarden met betrekking tot duurzaamheid zijn bijzonder streng. Datacenters moeten dus zo efficiënt mogelijk functioneren.

Dataopslagcapaciteit wordt een strategische troef voor bedrijven die hier op de lange termijn aan denken. Vooral nu de vraag onder impuls van AI toeneemt, moeten datacenters en bedrijven ver vooruit durven kijken. Het kan je immers een voordeel op de concurrentie opleveren. Maar dan moet je er op een slimme manier mee omgaan. Het verwijderen van data is in het AI-tijdperk uit den boze. Beter en slimmer plannen is voor iedere moderne organisatie een absolute must.

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content