Begin deze eeuw slaagde de mensheid erin om de meer dan drie miljard letters van haar genetische code volledig in kaart te brengen. Toen een internationale samenwerking in 1990 begon aan de ontrafeling van het menselijk genoom, leek dat nog een utopie. Door de snelle vorderingen in de computertechnologie was het project echter al in 2003 voltooid - vijftig jaar na de ontdekking van de DNA-molecule.

Vandaag kunnen we ook de unieke DNA-volgorde van iedere mens afzonderlijk uitlezen ('sequencen'). De kosten daarvoor zijn intussen onder de duizend dollar gedoken. Goedkope sequencing alleen bleek echter niet voldoende: ze levert je een boek met drie miljard letters in een taal die je nauwelijks kan lezen. De verkregen data moet ook nog 'vertaald' worden in biologische kennis. Dergelijke analyse van genoomgegevens vereist veel rekenkracht en kan meerdere weken in beslag nemen.

Om die genoomanalyse sneller te laten verlopen hebben onderzoeksgroepen van Imec, KU Leuven, UGent, UZ Leuven en drie bedrijven samen het Genome Analytics Platform (GAP) opgericht. Dat platform combineert cloud- en lokale rekenkracht met dataopslag om de volledige output van een sequencingmachine te verwerken in slechts 48 uur, en dat voor 48 genomen tegelijk.

"We starten met het afnemen van een DNA-staal, dat we in een sequencingmachine steken. Die machine knipt het genoom in stukjes van zo'n 100 tekens lang (A,C T of G) en puzzelt die daarna weer aan elkaar tot een lange reeks van drie miljard tekens. Om die puzzel sneller te maken gebruiken we statistische methoden en kunstmatige intelligentie. Normaal gezien duurt dat hele proces zo'n vijf dagen, maar wij hebben die fase teruggebracht tot één uur per genoom", aldus Roel Wuyts van imec's ExaScience Life Lab.

Het GAP-platform bestaat uit lokale hardware van Western Digital en een cloudoplossing van BlueBee. Geoptimaliseerde genoomanalysesoftware verdeelt het werk tussen het lokale rack (in het ziekenhuis aanwezig) en de cloud. Dat gebeurt op een kosteneffectieve manier: de software zorgt ervoor dat de hardware in honderd procent van de tijd wordt gebruikt.

In de praktijk is er dan een dag nodig om het staal klaar te maken, twee voor de sequencing en één voor de analyse. Daardoor wordt het sequencen én analyseren van het volledige genoom snel én betaalbaar voor ziekenhuizen. Die kunnen dit platform binnenkort niet alleen inzetten voor onderzoeksdoeleinden, maar ook voor de behandeling van patiënten in de dagelijkse praktijk. Agilent, eén van de projectpartners, heeft de hybride platformoplossing al geïntegreerd in een eerste product, dat wordt getest door het UZ Leuven en het Departement Menselijke Erfelijkheid van de KU Leuven om patiënten beter te behandelen.

Privacy

Tijdens de analyse wordt het genoom vergeleken met andere genomen, over de grenzen van individuele ziekenhuizen heen. Die kunnen niet zomaar uitgewisseld worden. Aangezien je genoom niet in verkeerde handen mag terechtkomen, is specifieke encryptie vereist. "Daar komt ook een heel user-managementsysteem bij kijken: Wie heeft toegang tot de genomen? Wie mag daar welke analyse op uitvoeren?", aldus Wuyts.

Met die privacy-restricties moet ook rekening gehouden worden als je kunstmatige intelligentie wil ontwikkelen om de dataset te helpen interpreteren. "We mogen geen informatie centraliseren. Dat verschilt van veel bestaande machine learning. Die algoritmes worden vooral gedreven door Amerikaanse techbedrijven of de Chinese overheid, die zo veel mogelijk data proberen te verzamelen. In Europa proberen we dat om te draaien. Je krijgt enkel toegang tot de informatie die je nodig hebt, niet tot een miljoen genomen."

Naar mobiele sequensingmachines?

Genoomsequencing wordt steeds sneller en goedkoper, een evolutie die razendsnel gaat. Wat mogen we over vijf jaar verwachten: je genoom uitlezen via je smartphone? "Daar werken we aan", lacht Wuyts. "Om te beginnen verwacht ik dat de sequencing-technieken kleiner en sneller worden. Die eerste drie dagen moeten we terug kunnen brengen tot enkele uren. Er zijn nu al een aantal kleinere toestellen op de markt, al is de foutenmarge daar nog iets groter dan bij de grote klinische toestellen."

"Ik denk dat we binnen de vijf jaar over draagbare sequensingmachines beschikken waarin de algoritmes om ze te analyseren al aanwezig zijn", voorspelt Wuyts. "Je zou de 'lessen' uit de sequentiebepaling en -analyse van je volledige genoom dan direct aan de arts kunnen tonen, die dan de belangrijkste boodschappen en mogelijke behandelingen met de patiënt kan bespreken. Misschien zelfs een uur nadat je een staal hebt gedoneerd."