Kanker is een belangrijke doodsoorzaak die ook notoir moeilijk te bestrijden is. Genetische factoren, omgevingsfactoren als vervuiling, roken en voedingsgewoonten kunnen allemaal bijdragen tot de ziekte, en daar is nog bijzonder veel over te leren. "Ons doel is om ons begrip van kanker uit te breiden en industrieën en onderzoeksinstellingen de kennis te geven waarmee ze op een dag mogelijk kunnen bijdragen aan behandelingen en therapieën," aldus IBM.

Onderzoekers van IBM's Computational Systems Biology groep in Zürich werken al een tijd aan een aanpak die kunstmatige intelligentie en machine learning gebruikt om uit te vissen welke mechanismes kunnen bijdragen tot kanker, en om meer te kunnen leren over de samenstelling van de tumoren zelf. Enkele van die projecten worden nu gedeeld met de rest van de wereld.

Het gaat om drie projecten. Het eerste heet PaccMann en is een algoritme dat automatisch chemische samenstellingen moet analyseren en voorspellen hoe effectief ze zouden zijn in het bestrijden van kanker. Dat zou het ontwikkelen van een medicijn moeten vergemakkelijken.

Het tweede heet INtERAcT en moet automatisch de belangrijke informatie uit academische papers halen die onderzoekers nodig hebben. Het idee daarachter is dat er elk jaar zo'n 17.000 papers worden gepubliceerd over kanker, en dat het bijna onmogelijk is voor onderzoekers om die allemaal te lezen.

Tot slot maakt IBM ook een 'pathway-induced multiple kernel learning' project openbron. Dat algoritme gebruikt datasets voor moleculaire interacties om te voorspellen welke richting een geval van kanker uit kan gaan, en of een patiënt mogelijk zal hervallen.