Einde van de theorie: maakt data wetenschappelijke modellen overbodig?

do 16 juni 2022
Einde van de theorie: maakt data wetenschappelijke modellen overbodig?
Premium

In de zomer van 2008 kwam Chris Anderson van het magazine Wired met het prikkelende artikel “The End of Theory: The Data Deluge Makes the Scientific Method Obsolete"1. Hierin betoogde Anderson dat allerlei (ingewikkelde) wetenschappelijke methoden overbodig (zullen) worden door de enorme berg data die er is in ‘The Petabyte Age’.

Ik benoemde in een eerdere bijdrage al eens het artikel van Anderson. Ik kom er nu wat uitgebreider op terug omdat het narratief van datagedreven werken aan kracht wint. Ik wil daar iets naast zetten: data gedragen werken. In bepaalde contexten is het goed denkbaar datagedreven automatisering van processen te ontwikkelen. Andere situaties vragen om meer continue contemplatie en reflectie in een datagedragen dialoog. Kleine leugens, grote leugens, statistiek De Amerikaanse schrijver Mark Twain schijnt ooit gezegd te hebben dat er drie soorten leugens zijn: “Lies, damned lies and statistics.” Met een overvloed aan data liggen leugens voor het oprapen. Daar heb je geen autoritair leider voor nodig. Iedereen kan in de verleidelijke valkuil trappen die correlatie heet. Websites zoals tylervigen.com laten waanzinnige correlaties zien, zoals tussen de consumptie van mozzarella en het aantal civiele ingenieurs diploma’s: in de jaren 2000 t/m 2009 hebben deze lijnen een vergelijkbare trend met een correlatie van boven de 95 procent!2 Complexiteit In bovenstaand voorbeeld is voor iedereen direct duidelijk dat sterke correlatie op geen enkele manier bewijs vormt voor een (onderliggend) causaal verband: er is geen relatie tussen oorzaak enerzijds (mozzarella verkoopaantallen) en gevolg anderzijds (aantal afgestudeerd civiel ingenieurs). In andere gevallen kan dat lastiger zijn. Zeker in een complexe sector zoals de gezondheidszorg, met factoren die elkaar over en weer beïnvloeden, is een duidelijke relatie tussen oorzaak en gevolg soms een soort wensdenken. “De data toont aan…” klinkt overtuigend, maar zou dat niet mogen zijn. Complexiteit duiden met data, zonder kritische blik op de gevonden relatie, is een enorm risicovolle aanpak. Niet iets om in de gezondheidszorg na te streven. Leren In plaats van schijnzekerheid te veinzen met data kunnen we beter vooraf al het leren centraal stellen. In een complexe, snel veranderende wereld is de organisatie die snel(ler) leert spekkoper. Dat leren hoeft niet altijd via de wetenschappelijke route, daarover ben ik het met Chris Anderson eens. De zeer grondige wetenschappelijke methoden en technieken kosten veel tijd en kunnen de veranderingen in de praktijkvraag vaak niet bijbenen. Daar moeten we dus wat naast zetten: datagedragen onderzoek in de praktijk, gericht op het vergroten en versnellen van ons lerend vermogen. Leiderschap Maar contemplatie en reflectie kosten tijd. En leren betekent dat je heel vaak iets (nog) niet weet. In een structuur waarin antwoorden worden verwacht en tijd schaars is, levert dit dus direct spanningen op. Daarom is sterk leiderschap nodig om ruimte te creëren én behouden in de hoofden en harten van medewerkers. Niet eenmalig als gimmick, maar structureel als houding. Niet voor de korte termijn kiezen maar voor de lange termijn gaan. Simon Sinek noemt dat “the courage to lead” in zijn nieuwste boek ‘The Infinite Game’3 . Ik noem dat: niet voor de ‘quick wins’ maar voor de ‘big wins’ kiezen. Kleuters Om je heen kijken, een hypothese formuleren, een experiment verzinnen, het experiment uitvoeren, de resultaten interpreteren, op basis daarvan een nieuwe hypothese formuleren en weer nieuw experiment verzinnen etc. Het is niet niks wat we van professionals vragen. Het goede nieuws is: iedereen kan het. Of nou ja, kon het. Joep van der Graaf toonde in zijn proefschrift van 2017 al aan dat kleuters deze manier van denken (‘scientific reasoning’) beheersen4 . We hoeven dus geen manier van doen aan te leren, maar alleen de belemmerende factoren te verwijderen en zo onze innerlijke kleuters vrij spel geven. Egge van der Poel is een ervaren data scientist, natuurkundige en filosoof, docent bij TIAS en JADS en onafhankelijk adviseur.