Achter de schermen bij Disk Archive: dataschijven die niet draaien, kunnen decennia mee
In de archieven van tv-stations liggen gigantische stapels videotapes te wachten op digitalisering. En de tijd dringt. ‘Want wat ben je met een video die je niet meer kunt afspelen?’
Het archiveren van film- en tv-beelden blijft een grote uitdaging. ‘VHS is intussen al twintig jaar van de markt verdwenen’, zegt Alan Hoggarth, oprichter en CEO van Disk Archive. Zoals de naam laat vermoeden, specialiseerde het bedrijf zich in archiefoplossingen op schijf. Hoggarth stelde zijn onderneming voor in het kader van de IT Press Tour, eind vorig jaar in Madrid. ‘Mediabedrijven werken ook al twintig jaar niet meer met professionele videotape. Alles gebeurt digitaal: op schijf.’
Maar daarmee is de uitdaging van het archief niet van de baan. De hoeveelheid beeldmateriaal die een mediabedrijf bewaart groeit alleen maar. ‘Tegelijk zitten er in het archief nog altijd bergen van die oude videotapes’, weet Hoggarth. ‘Die zijn niet zomaar toegankelijk of beschikbaar, maar tegelijk wil zo’n bedrijf die schat aan beelden ook niet verliezen.’
En ondertussen tikt de klok. De bewaartijd van een tape – niet alleen van VHS, maar ook van de latere, digitale videotape – is niet onbeperkt. Het laatste wat een mediabedrijf wil is dat het een tape met uniek beeldmateriaal uit het archief haalt, om dan vast te stellen dat de beelddrager niet meer bruikbaar is.
Opslag met kleinste voetafdruk
Kortom: alles digitaliseren en op schijf bewaren? Dat doe je volgens Alan Hoggarth beter niet zomaar halsoverkop. ‘Zet je alles op spinning disks, dan loop je een groter risico dat je beeldmateriaal verliest dan wanneer je alles in het archief op tape laat staan’, lacht hij. De levensduur van schijfopslag is immers beperkt. In een professionele context is het gangbaar om de opslagomgeving elke vijf jaar te vernieuwen. Met dus telkens een datamigratie – en het bijhorende risico op dataverlies. Daar komt nog bij dat aan spinning disks een pittig prijskaartje hangt – niet alleen in aankoop, maar vooral ook door hun energieverbruik.
Disk Archive biedt een alternatief. Het Britse bedrijf – opgericht in 2008 – bouwt oplossingen voor opslag op schijf, maar legt die schijven vervolgens stil. Om een idee te geven: ALTO-III is een appliance met ruimte voor zestig diskdrives. Gebruik je schijven van 24 TB, kom je zo aan een capaciteit van 1,44 PB oftewel petabyte. Aan de appliance kun je tot tien extra nodes toevoegen, met elk opnieuw zestig disks. ‘Klanten brengen hun eigen schijven mee. Vaak gebruiken ze zelfs verschillende merken door elkaar.’ De kern van het verhaal is dat Disk Archive inzet op de laagst mogelijke voetafdruk – en zo op het vermijden van onnodige kosten.
Lange bewaartijd
De oplossing volgt het principe van MAID (Massive Array of Independent Disks) en dus niet RAID, zoals bij ‘klassieke’ opslag. Het idee is simpel: door de schijven stil te leggen, verbruiken ze geen energie en verslijten ze niet. Dat maakt de vijfjaarlijkse vernieuwing overbodig. Disk Archive voorziet een online index die bijhoudt wat er op welke schijf staat en amper 210 watt per terabyte verbruikt. De drives zelf zijn compleet offline. Zo blijft het stroomverbruik extreem laag. ‘Hoelang een schijf zo mee kan gaan, weten we nog niet’, zegt Hoggarth. ‘Maar wel minstens vijftien jaar, aangezien ons bedrijf al vijftien jaar bestaat.’
Die lange bewaartijd biedt ook mogelijkheden in sectoren buiten de media. ‘Ik denk dan bijvoorbeeld aan het bewaren van beelden die als wettelijk bewijsmateriaal gelden’, klinkt het, ‘zoals opnames van zittingen van rechtbanken. Rechtszaken lopen soms langer dan vijf jaar, waardoor de behoefte ontstaat om beelden over een langere tijdsspanne te bewaren.’ Mogelijk zouden ook andere sectoren baat hebben bij de oplossing van Disk Archive.
Een kopie op tape
Het concept van Disk Archive is maar zinvol voor data in rust: data die niemand bewerkt en die maar heel zelden wordt geraadpleegd. Tegelijk laat het systeem toe om relatief snel beelden op te vragen: het duurt zestig seconden om zo’n ‘slapende’ schijf op te starten. Dat lijkt misschien niet superhandig, maar blijft wel werkbaar. En daarbij, wat is het alternatief? ‘Een archief op disk in de cloud zetten, is niet betaalbaar’, zegt Alan Hoggarth. Unmanaged tape storage in de cloud, dan maar? ‘Dat is totaal onpraktisch. Het duurt dan al snel vijf tot tien uur om een item op te vragen.’ Een nieuwsredactie, bijvoorbeeld, is daar in de praktijk niets mee.
Het enige zinvolle alternatief volgens Hoggarth is unmanned tape: geautomatiseerde opslag op datatape. Al blijft het idee wat raar: een videotape digitaliseren en vervolgens archiveren op een datatape. ‘Zo’n kopie op tape in een datacenter kan je wel achter de hand houden als allerlaatste optie.’ Het neemt niet weg dat tapemigratie een dure en onpopulaire aangelegenheid blijft. ‘En tape is gevoelig voor stof en vocht’, vervolgt de CEO. ‘In grote delen van Azië en Afrika ben je dan bijvoorbeeld sterk afhankelijk van airco. Daar heeft onze oplossing alvast geen last van.’
Waarom stappen de aanbieders van taperobots dan niet mee in de markt van non-spinning disks? ‘Omdat het veel meer opbrengt om bij klanten tapes te vernieuwen’, lacht Hoggarth.
Goedkope beveiliging
En wat met de beveiliging van het archief op schijf? Ook op dat vlak biedt Disk Archive een kleine voetafdruk. ‘Heel simpel, door een kopie van een schijf uit het opslagsysteem te halen en in een kast te bewaren’, legt Hoggarth uit. Op de doos komt een QR-code met de inhoudstafel van de tape. ‘En je zou nog een allerlaatste kopie in de cloud kunnen zetten. Met als uitgangspunt deze uitsluitend terug te halen – want dat is erg duur en duurt letterlijk uren – wanneer bijvoorbeeld een brand de andere kopieën heeft vernield.’
Fout opgemerkt of meer nieuws? Meld het hier