Marilou Jansen over betrouwbaarheid Stanford University onderzoek wearables

De onderzoekers aan de Stanford University dachten dat er meer te halen en doen moet zijn met die gegevens. En om te achterhalen wat, onderzochten ze om te beginnen zeven verschillende apps die voor iedereen beschikbaar zijn: MOVES, Basis, Scanadu (inmiddels van de markt), Scout, iHealth-finger, Masimo, RadTarge en Withings. Gezamenlijk leverden de apps 250.000 meetpunten per dag op. Om te testen hoe makkelijk en betrouwbaar de data waren gebruikte mede-auteur van de studie twee jaar lang deze zeven apps.

Daarnaast werden 60 proefpersonen voor ongeveer twee jaar gevolgd om de betrouwbaarheid van de gevonden meetwaarden te controleren. De onderzoekers stelden voor 43 proefpersonen een zogenaamde baseline vast en bekeken op basis daarvan welke afwijkingen optraden en wat die te betekenen hadden.

Weinig zuurstof: vermoeidheid

Ook het zuurstofgehalte in het bloed tijdens vliegreizen werd getest. Opvallend was dat het zuurstofgehalte in het bloed aanmerkelijk lager was in een vliegtuigcabine dan op het land. Hoe hoger het vliegtuig vloog, hoe lager het zuurstofgehalte. Aan het einde van lange vluchten (langer dan zeven uur) normaliseerde dit gehalte weer enigszins. Dat zou kunnen verklaren waarom mensen tijdens vluchten vaak in slaap vallen: een laag zuurstofgehalte gaat vaak gepaard met vermoeidheid.

Wat nog meer opviel was dat proefpersoon 1 in de eerste vijf dagen van de testperiode last kreeg van een verhoogd hartritme en verhoogde huidtemperatuur, vervolgens koorts en andere ziekteverschijnselen. Vanwege een eerder bezoek aan een boerderij in een bosrijk gebied, vermoedde de proefpersoon Lyme. Eenmaal bij de huisarts bleek zijn eigen diagnose juist en na een kuur met doxycycline verdwenen de hoge meetwaardes.

Betrouwbare voorspeller

Om de betrouwbaarheid van de afwijkende waarden te testen onderzochten de wetenschappers drie andere proefpersonen die hadden aangegeven ziek te zijn geweest tijdens de testperiodes. Voor alle ziekteperiodes bleek het verhoogde hartritme een betrouwbare voorspeller dat iemand iets onder de leden heeft. De verhoging in huidtemperatuur kon niet overal worden teruggevonden.

Verder ondergingen twintig mensen een glucosetest om te bepalen of ze resistent waren voor insuline, een indicatie voor het ontwikkelen van diabetes type 2. Twaalf proefpersonen bleken resistent. De wetenschappers ontwikkelden een algoritme op basis van het dagelijkse stappenaantal, het hartritme gedurende de dag en het verschil tussen het hartritme overdag en ’s nachts. Dit algoritme kon daarna ‘voorspellen’ welke proefpersonen uit de groep waarschijnlijk resistent waren voor insuline. Een dergelijk algoritme zou, mits verder ontwikkeld, een relatief simpele test kunnen zijn om na te gaan of iemand binnen de risicogroep voor diabetes type 2 valt.

Hoe betrouwbaar is data

Zijn deze resultaten nu betrouwbaar, is de grote vraag. Arts-onderzoeker bij het AMC Marilou Jansen heeft onlangs een grote literatuurstudie gedaan over wearables. Zij is voorzichtig over de resultaten die uit het onderzoek van Stanford naar voren komen. Jansen: ‘Het medisch valideren van zo’n wearable is lastig. Je moet ten eerste testen of ze onder perfecte condities dezelfde waarden leveren als de geijkte medische apparatuur, want je wil zeker weten dat de metingen kloppen. Daarna moet je controleren of de drager ervan de meting ook goed uitvoert. Vaak zie je dat als je die metingen niet helemaal doet zoals het hoort, de uitslagen meteen afwijkingen vertonen.’

De auteurs van het Stanford University onderzoek verklaarden dat het regelmatig voorkwam dat één van de proefpersonen de sensors niet helemaal goed gebruikte of dat mensen de wearable ’s nachts niet droegen. Volgens Janssen kan dit de resultaten behoorlijk beïnvloeden. ‘Je hebt dan misschien wel 250.000 metingen, maar die zijn uitgevoerd door een heel kleine groep. Als een klein deel daarvan de metingen verkeerd doet, kunnen bijvoorbeeld 50.000 metingen niet voldoen. Dat is een substantieel aantal en dan kun je niet zomaar harde uitspraken doen.’

De potentie is er

Dat wearables de potentie hebben om medisch betrouwbare data te meten weet Jansen ook. In haar eigen onderzoek constateerde ze dat er een groot gat zit tussen het gebrek aan betrouwbare medische literatuur die over dit onderwerp te vinden is en het aantal voor consumenten beschikbare sensoren, zoals ook te vinden in de opensource wearable database Vandrico. Iedereen kan daar een review met informatie over een wearable achterlaten.

‘Wearables komen in zo’n hoog tempo op de markt dat de wetenschap het valideren ervan niet kan bijhouden. Dat maakt het heel lastig hier goede onderzoeken over te vinden.’ Het onderzoek van Stanford is een stap in de goede richting, maar wat Jansen betreft zijn we er nog niet: daarvoor moeten de metingen eerst voldoende getest zijn. ‘Er zit belofte in wearables, dat weten we. Nu moeten we nog een manier vinden om de metingen betrouwbaar te valideren.’