Data benutten om Covid-19 uitbraken te voorspellen

vr 11 december 2020
Data benutten om Covid-19 uitbraken  te voorspellen
Diagnostiek
Premium

Een nieuw computermodel moet het makkelijker maken om uitbraken van het coronavirus te voorspellen. Het maakt gebruik van de zoekactiviteiten van artsen op de online beslissingsondersteunende tool UpToDate, gecombineerd met data van social media, internet-zoektrends en mobiele gegevens van smartphones. Op deze manier moet een early warning systeem een uitbraak kunnen voorspellen twee tot drie weken voordat die plaatsvindt.

Dat juist in de Verenigde Staten behoefte bestaat aan een voorspellend model voor uitbraken van het coronavirus, is natuurlijk niet verwonderlijk. In de ranglijst van de landen met de meeste nieuwe besmettingen per dag ‘scoort’ de VS al geruime tijd erg hoog. Dit maakt het interessant om over stuurinformatie te beschikken die lokale autoriteiten in staat stelt om op tijd maatregelen te nemen die een verwachte uitbraak een halt toe kunnen roepen.
UpToDate als basis
Het onderzoek dat naar het voorspellende model leidde, is een idee van dr. Mauricio Santillana, directeur van het Machine Intelligence Lab van Boston Children’s Hospital. Santillana gebruikte als basis voor zijn model het antwoord op de vraag hoe de diverse gegevensstromen waarop hij dit wilde baseren, correleerden met het aantal gevallen van Covid-19 en het aantal sterfgevallen hieraan in de VS in maart en april van dit jaar.
De gegevensstromen die hij hiervoor benutte, waren de zoekactiviteiten van artsen op de online tool UpToDate, data van social media, internet-zoektrends en mobiele gegevens van smartphones. Zo ontdekte hij bijvoorbeeld dat op Twitter sprake was van een grote toename van het aantal tweets over Covid-19 ruim een week voordat medio maart het aantal gerapporteerde gevallen in New York een dramatische stijging liet zien. Verder onderzoek toonde aan dat ook het aantal gerelateerde zoekopdrachten op Google en Kinsa- temperatuurmetingen1 enkele dagen voor die piek toenam. De basis om de bovengenoemde gegevensstromen met elkaar te combineren, was geboren.

Praktische vragen
Maar er zitten stappen tussen een idee en een werkbaar model. De bronnen die Santillana met elkaar combineert, roepen enkele voor de hand liggende vragen op. Om te beginnen natuurlijk: wat is UpToDate?

Santillana: “Dat is een klinische bron van Wolters Kluwer die artsen, verpleegkundigen en andere clinici gebruiken om medische aandoeningen te onderzoeken en beslissingen te nemen voor de behandeling en zorg van patiënten. Het is geschreven door artsen en wordt gebruikt door meer dan twee miljoen zorgprofessionals wereldwijd. De rol ervan in het algoritme is om te bevestigen dat zoekopdrachten van artsen over Covid-19 zoveel mogelijk overeenkomen met klinische opnamen van patiënten bij wie Covid-19 wordt vermoed.”

So far so good. UpToDate is dus een hulpmiddel voor professionals. Die zullen niet snel geneigd zijn ‘los’ te gaan op informatie die her en der op internet te vinden is over Covid-19 en niet of onvoldoende te controleren is op betrouwbaarheid. Dat blijkt te kloppen, aldus Santillana: “UpToDate-activiteit hielp bij het vooraf identificeren van een opwaartse trend in bevestigde gevallen. Bovendien kwam het ook naar voren als een vroeg signaal van een stijgende trend voor sterfgevallen met 4,5 weken.”