Hoe digitaliseert het Vaticaan zijn bibliotheek?

06/05/15 om 03:39 - Bijgewerkt om 03:39

Bron: Datanews

In 2013 begon Vaticaanstad met een zeer ambitieus project: zo goed als alle stukken digitaliseren op een manier dat ze voor iedereen beschikbaar worden en blijven. Op EMC World legt de Cio van het Vaticaan uit hoe belangrijk het juiste dataformaat is.

Hoe digitaliseert het Vaticaan zijn bibliotheek?

Paus Franciscus © REUTERS

Het project zelf duurt negen jaar en zal zo'n veertig miljoen pagina's indexeren uit de bibliotheek die al sinds 1475 bestaat, maar stukken bevat die nog veel ouder zijn dan de bibliotheek zelf. Als alles is afgerond zal er naar schatting zo'n 2,8 petabyte aan data nodig zijn.

"We wilden dit doen met een gegarandeerde interoperabiliteit, zodat we dit binnen vijftig jaar of later nog steeds kunnen gebruiken," legt Luciano Ammenti, chief Information Officer van de Heilige Stoel uit. Zo gebruikt de organisatie Fits als afbeeldingsformaat, een relatief onbekende standaard die vooral wordt gebruikt om wetenschappelijke gegevens (onder meer voor astronomie) te bewaren.

De voordelen zijn volgens Ammenti groot. Zo werkt Fits op 64 bit, kan het een onbeperkte bestandsgrootte aan, ondersteunt het 3D visualisatie en is de standaard openbron die bovendien regelmatig wordt uitgebreid naarmate technologie evolueert. "Wat het makkelijk maakt is dat Fits bijna alle mogelijke data over een document bevat. Sommige stukken bevatten goud, zilver of andere delicate stoffen, dat moet je ook kunnen opnemen als je een document scant."

FITS is volgens Vaticaanstad beter geschikt dan TIFF om documenten te digitaliseren.

FITS is volgens Vaticaanstad beter geschikt dan TIFF om documenten te digitaliseren. © Pieterjan Van Leemputten

Niet alles wordt gedigitaliseerd. Zo beslist een team van specialisten of iets kan gedigitaliseerd worden zonder het te beschadigen. "Daarna kiezen we met welk toestel we gaan digitaliseren, maar na de scan checken we ook het hele bestand." Dat is volgens Ammenti een cruciale stap want hoe nauwkeuriger de digitalisering, hoe waardevoller het databestand blijft in de jaren die volgen."

Toch blijft de digitalisering niet zonder risico. De kwaliteit kan verminderen over tijd. "Daarom wordt elk bestand dat we maken elke zes maanden gecontroleerd." Het Fits-formaat krijgt ook regelmatig een update. Maar dat vormt volgens Ammenti geen probleem. "Vergelijk het met Unix, dat bestaat al decennia, is vandaag geëvolueerd en in verschillende vormen beschikbaar, maar het werkt in de kern nog op dezelfde manier."

Ook de scanners zelf worden onderworpen aan een grondige controle "Elke tweeduizend afbeeldingen wordt een scanner opnieuw gecalibreerd, bijvoorbeeld om de levendigheid van de kleuren te controleren." Ook worden de scans op meerdere plaatsen bewaard om bij een ramp niet de hele digitale bibliotheek te verliezen.

"We willen iet creëren, niet voor ons maar voor degenen die na ons komen, iets wat binnen honderd jaar nog altijd leesbaar en raadpleegbaar is voor iedereen in de wereld," Aldus Ammenti.

Onze partners