Kris Peeters
Zijn data de grote schuldigen van de coronacrisis?
In een artikel in De Tijd vertelt Peter Hinssen hoe ontgoocheld hij is door big data in de coronacrisis. Dataspecialist Kris Peeters ziet daar een aantal kritische denkfouten in die hij wel vaker ziet terugkomen, ook in de industrie, die hij wil toelichten.
Mensen willen ‘data driven’ worden.
‘We wilden allemaal iets te graag geloven in de magische buzzwords. En dromen van die betere wereld waarnaar data en algoritmes ons zouden leiden’, stelt Peter Hinssen in het artikel.
Geleid door de data. Letterlijk. Terwijl data niks meer zijn dan uitlaatpijpen van processen. Daarom zijn wij ook ‘data minded’ maar niet ‘data driven’. Data moeten met de juiste context aan de juiste mensen gegeven worden. Computers mogen zelf insights bouwen. Maar je mag niet de human out of the loop halen. In covidtijden: denk aan mensen als Niel Hens, die de data als input gebruiken voor hun model. Om uiteindelijk, met heel veel onzekerheid (terecht) te communiceren over mogelijke outcomes. Ik heb trouwens de eer en het genoegen gehad om Niel Hens te interviewen voor Data Science Leuven op YouTube. Zeker kijken voor een genuanceerde kijk op data en covid.
Mensen zijn heel slecht in kansberekening.
‘Mijn Covid Safe Ticket bewijst vooral dat ik de regeltjes heb gevolgd, niet dat ik een lager risico voor de maatschappij vorm.’
Mensen zijn heel slecht in kansberekening. Wat hij zegt is gewoon onjuist. Een CST bewijst wel degelijk dat je een lager risico vormt voor de maatschappij. Je hebt minder kans om besmet te geraken, minder kans om het virus door te geven, minder kans om in het ziekenhuis te belanden, minder kans om beademing nodig te hebben.
Is de kans nul? Nee. Duwt omikron de kansen op besmetting omhoog? Ja. Is die kans alsnog klein genoeg om een implosie van het ziekenhuissysteem te voorkomen? Absoluut. Een ander, klassiek voorbeeld van hoe mensen slecht zijn in kansberekening is het Monty Hall-probleem. Intuitief klopt dat niet. Wiskundig wel.
Mensen kunnen niet om met onzekerheid in data.
‘De vraag naar een endgame wordt dan ook acuut. Daar verdienen wij makke schapen, met ons vol CST-kaartje, toch een antwoord op.’
Er wordt een antwoord verwacht, altijd. En in business klopt dat wel: making no decision is often worse than any random decision. We willen allemaal een endgame. Maar we weten niet hoe het virus nog gaat muteren. We weten niet hoe snel de farmabedrijven kunnen blijven inspelen op die veranderingen. We weten niet wat de impact op de economie gaat zijn. Voorspellingen op die schaal zijn vaak complete onzin. Dus keuzes van politici moeten ook altijd voorwaardelijk zijn, op basis van de informatie die ze nu hebben. Het endgame van corona is pas ingezet als het virus dat wil.
Wees ontgoocheld in de datamaturiteit van mensen.
Dus conclusie, voor mij, is het niet zozeer de ontgoocheling in big data. Maar wel de ontgoocheling in de data maturity van de gemiddelde mens of gemiddelde politicus. Data zijn slechts tools. Laat je nooit leiden door een tool. Luister naar de experts. Aanvaard onzekerheden. Daarmee wil ik niet gezegd hebben dat de politiek goed bezig is. Maar dit soort opiniestukken brengt ons niet dichter bij een oplossing.
Fout opgemerkt of meer nieuws? Meld het hier