Een scheikundelab in de cloud
Een algoritme creëert een nieuwe chemische stof, een robotgestuurd labo stelt ze samen: menselijke chemici zouden er dagen aan werken, voor het RoboRXN-systeem van IBM is het een klein uurtje werk.
Op termijn kan deze nieuwe vondst miljoenen levens redden, zegt de technologiereus: ze haalt de toekomstige ontwikkeltijd en kost van geneesmiddelen of vaccins potentieel naar een tiende van vandaag. Als je héél kort door de bocht gaat, zegt Alain Vaucher, is het creëren van een nieuwe chemische stof zo’n beetje hetzelfde als het bakken van een appeltaart. “Je volgt gewoon een recept met meerdere stappen”, vertelt de researcher bij het Europese lab van IBM in Zürich. “Eerst moet je de ingrediënten kennen en verzamelen. Daarna breng je ze in de juiste volgorde samen. Maar het recept is meer dan een stappenplan: er zijn doseringen in het spel, verschillende texturen in het deeg dat je gebruikt. Het belangrijkste verschil tussen appeltaarten bakken en chemie is dat de operationele details bij een appeltaart min of meer duidelijk zijn. Bij chemie gaat het om ongestructureerde data, die lastiger te interpreteren zijn.”
Het maakt de taak van de scheikundige geen sinecure. De onderzoeksmethodes naar synthetische chemie zijn de afgelopen eeuw nauwelijks veranderd: chemici gebruiken nog steeds dezelfde tijdrovende protocollen, dezelfde slepende modus operandi, als ten tijde van de ontdekking van pakweg nylon of aspirine in de vroegste jaren van de twintigste eeuw. Traditioneel duurt het tien jaar, en tien miljoen Amerikaanse dollars, om een nieuwe chemische stof – zij het een geneesmiddel of een kunststof – te ontwikkelen.
Doorbraak
Bij IBM willen ze dat proces nu gevoelig versnellen door die ongestructureerde data in de cloud op te slaan, het speurwerk te automatiseren via AI, en het uiteindelijke synthetiseren ervan te laten doen door een robot. Eerste testen van dat RoboRXN-proces liggen al achter de rug, en IBM denkt dat dit soort technologie ergens binnen de komende tien jaar courant gebruikt zal worden door chemici.
De opbrengst daarvan zal zowel in de doorlooptijd als in de kosten van de ontwikkeling van nieuwe chemische materialen te voelen zijn. “De doorlooptijd zal naar één jaar gaan, de kost naar één miljoen”, zegt Joppe Geluykens, een Belgische maar eveneens in Zürich gevestigde specialist in scheikunde, machine learning, AI en neurolinguïstisch programmeren. “Het zogeheten discovery process, waarbij chemici met experimenten tot de juiste verbindingen komen, wordt gevoelig versneld. We hebben bijvoorbeeld net een test gedaan waarbij we een molecule die mogelijk een effect heeft op de Covid-19-proteïne hebben samengesteld door middel van AI en robotica, zonder menselijke interventie.”
Concreet: wanneer dit systeem commercieel op poten staat – “ergens binnen de komende tien jaar”, schat Vaucher in – kan het de ontwikkelingstijd van een virusvaccin naar een tiende van vandaag trekken. Of misschien vinden onderzoekers dankzij dit systeem wel een nieuwe, milieuvriendelijkere meststof uit?
BrCCOC1OCCCC1
In 2018 bouwde IBM machinelearningmodellen die chemische reacties kunnen voorspellen, en lanceerde het bedrijf die in een onlinedienst die het RXN for Chemistry doopte. Het hart daarvan is een dataset van meer dan 70 jaar aan patenten in de chemische sector, en een algoritme dat de chemische data daaruit onttrekt. Die patenten bevatten namelijk alfanumerieke vertalingen van de moleculen zelf, die met waarden als (een voorbeeld dat IBM zelf aangaf in een test van het systeem die Data News meevolgde via WebEx) BrCCOC1OCCCC1 worden aangegeven. “De verwerking daarvan gebeurt vervolgens op basis van natural language processing“, zegt Geluykens. “Net zoals we onze computers hebben getraind op het herkennen van menselijke taal, lezen onze AI-modellen die patenten uit, en halen ze er de nuttige data uit. Er is een model dat een retrosynthese maakt, van het doelproduct terug naar de ingrediënten, en een tweede waarbij die laatste weer in een nieuw recept worden gegoten.”
RXN for Chemistry werd de afgelopen twee jaar al door 15.000 onderzoekers gebruikt, die samen al meer dan 760.000 chemische reacties lieten voorspellen door het systeem. Maar nu het werd uitgebouwd tot RoboRXN, kunnen er op basis van die nieuw verworven data ook stoffen fysisch worden gemaakt. IBM heeft daarvoor in Zürich een scheikunderobot gebouwd zonder propriëtaire componenten of processen erin, zodat hij makkelijk kan worden nagebouwd met commercieel verkrijgbaar materieel. “Dit project is hardware-agnostisch”, zegt Teodoro Laino, directeur van IBM’s researchlabo in Zürich. “Het kan interfacen met verscheidene soorten apparatuur.”
Niet op het kapblok
Die installatie, en het neurale netwerk dat de ontdekkingen doet, worden aangesproken vanuit een cloudplatform dat IBM heeft opgetrokken: een browsertoepassing waarin de wetenschapper de moleculaire structuur uittekent van de op dit moment nog hypothetische eindverbinding die hij of zij wil maken. Op basis van die doelmolecule gaat het platform op zoek naar ingrediënten, en stelt het een volgorde samen waarin die moeten worden gemengd. Want het is, buiten de hoogtechnologische hocuspocus, nog altijd een menselijke wetenschapper die de touwtjes in handen houdt: al het voorgaande betekent in de verste verte niet dat de job van chemicus een van de volgende menselijke professies wordt die op het kapblok ligt door toedoen van AI, zeggen de onderzoekers. Het idee is dat de twee naast elkaar zullen werken. De technologie heeft het voordeel dat ze in essentie onvermoeibaar is (een algoritme en een robot kunnen dag en nacht doorwerken), de mens wordt ontzorgd (het systeem kan vanop afstand worden bediend, bijvoorbeeld vanop een laptop op de keukentafel van de chemicus).
“Wanneer je dit schaalt naar meerdere robots, kun je zelfs verschillende experimenten in parallel uitvoeren”, zegt Geluykens. “De onderzoeker kan de daardoor gewonnen tijd gebruiken om zich op het creatieve aspect van het onderzoek te richten. Alleen het praktische element wordt hem uit handen genomen: het manuele werk dat de robot doet, bijvoorbeeld, is voor een chemicus eerder een vervelende taak. Het laat opnieuw zien dat mens en machine allebei een duidelijke rol behouden in het proces. De optie bestaat om dit volledig autonoom te doen: de chemicus geeft een doelmolecule op, en vanaf dat moment is het volledig hands-off. Maar de onderzoeker stuurt het proces aan, en tussen het AI-onderzoek en het punt waar de robot begint kan hij nog bijsturen op basis van zijn expertise.”
Fout opgemerkt of meer nieuws? Meld het hier