iRODS koppelt datagebruikers los van de infrastructuur
Grote hoeveelheden data beheren – denk aan universiteiten en onderzoeksinstellingen – is al moeilijk genoeg. Die informatie op een efficiënte manier doorzoeken, over verschillende technologieën heen, zorgt voor een nog grotere uitdaging. Net dat wil het consortium iRODS eenvoudiger maken.
iRODS is een start-up met een academische achtergrond. Tenminste, als het er op termijn van zou komen de oplossing in een apart bedrijf onder te brengen. Momenteel is iRODS opgevat als een consortium, gesteund door een handvol partners uit de academische en de bedrijfswereld. Onder meer de KU Leuven en de UCL werken eraan mee. ‘Onze roots liggen in de jaren negentig, bij een supercomputingcentrum in San Diego’, zegt Terrell Russell, directeur van iRODS. Data News ontmoette de man in het kader van de IT Press Tour.
Doelgericht
In 2008 ging het team van iRODS – vandaag bestaande uit een tiental medewerkers – aan de slag binnen het Renaissance Computing Institute van de Universiteit van North Carolina, waarna het huidige consortium vanaf 2013 vorm kreeg. iRODS staat voor integrated rule-oriented data system. Het gaat om een opensource, programmeerbaar bestandssysteem. ‘Je kan het gewoon draaien op een laptop’, vertelt Russell, ‘maar evengoed op een cluster, on-premise of geografisch gedistribueerd.’ Een greep uit de toepassingsdomeinen: supercomputing, bibliotheken en archieven, genoomonderzoek, gezondheidszorg, …
‘Het gaat erom dat je op een gemakkelijke manier grote hoeveelheden data beheert, verspreidt over allerhande opslagtechnologieën, en de toegang tot die data controleert’, stelt Russell. Het gebruik van metadata blijkt daarbij heel belangrijk: ‘We voegen metadata toe op een geautomatiseerde manier, zodat je – vanuit het standpunt van de gebruiker – de juiste data veel makkelijker terugvindt, en er zo de waarde van verhoogt’. Het laat een heel doelgerichte zoektocht binnen diverse databronnen toe, net als een zeer grondige audit.
Terrell Russell, directeur van iRODS: ‘Beschouw het als een database die verwijst naar de locaties waar de eigenlijke data staan’.
Abstractielaag
‘Eigenlijk moet je het zo zien: onze oplossing fungeert als een grote database die verwijst naar de locaties waar de eigenlijke data staan: in clouds, on-premise, in archiefsystemen, enzovoort.’ iRODS zorgt voor een abstractielaag die zowel de gebruiker als de data als het ware loskoppelt van de onderliggende infrastructuur. De oplossing maakt daarbij gebruik van automatische workflows, met onder meer de verplichte toepassing van allerlei instelbare regels. ‘Neem bijvoorbeeld een satelliet, die voortdurend nieuwe data aanlevert’, gaat de directeur verder. ‘Je kunt die gegevens opvangen in een landing zone, waarna iRODS de data bekijkt, automatisch van metadata voorziet en bepaalt waar de opslag gebeurt.’
Soms loopt het proces ook andersom. ‘Dat is het geval met data die je niet kan of mag verplaatsen, bijvoorbeeld omdat het te complex of te duur is. In dat geval leidt iRODS de rekenkracht naar de data, in plaats van omgekeerd.’ Op die manier kan je eenvoudig tijdelijk databronnen samenbrengen onder iRODS, bijvoorbeeld in het kader van een samenwerkingsproject.
Anderen helpen besparen
Zoals gezegd: iRODS is een consortium. ‘We behoren tot een onderzoeksinstelling. We zijn geen commercieel bedrijf en kunnen onze gebruikers daardoor ook geen garanties bieden, bijvoorbeeld onder de vorm van een SLA.’ Of dat op termijn verandert, is maar de vraag. ‘We zijn heel blij met hoe alles nu loopt’, zegt Russell. ‘Maar het is soms ook vreemd om te beseffen hoeveel geld we laten liggen, louter omdat we geen commerciële organisatie zijn. Maar dat maakt wat we doen daarom niet minder waardevol. We helpen andere organisaties om te besparen.’
Mocht iRODS ooit het commerciële speelveld willen betreden, dan is een investering in de user interface wellicht geen overbodige luxe. ‘Daar hebben we inderdaad nooit veel aandacht voor gehad’, geeft Terrell Russell toe. Bedrijven als Starfish en Hammerspace, die zich min of meer in hetzelfde domein begeven, doen dat wel. ‘Dat klopt, die bedrijven verkopen een black box’, besluit Terrell Russell. Ook daarin schuilt een verschil: iRODS vraagt wat meer tijd om het systeem te leren kennen en naar je hand te zetten.
Fout opgemerkt of meer nieuws? Meld het hier