Veilig data analyseren, zonder data te delen

do 13 april 2023
Veilig data analyseren, zonder data te delen
Samenwerking
Premium

Wie onderzoek wil doen op basis van data, moest daarvoor tot voor kort data uitwisselen; gegevens anonimiseren; steeds opnieuw datasets samenstellen. Dankzij de samenwerking van IQVIA en Roseman Labs rond Multi-Party Computation, zijn de mogelijkheden ineens vrijwel eindeloos. Om data uit verschillende bronnen te analyseren, is het delen ervan niet meer nodig. En dat betekent dat geen onderzoeksvraag meer te gek is.

Multi-Party Computation (MPC) maakt het mogelijk voor zorginstellingen, kennisinstellingen, overheden en registratieautoriteiten om gezamenlijk breed onderzoek te doen op basis van privacygevoelige data, zonder die data uit te hoeven wisselen. 

“We bouwen tijdelijke databruggen waarop analyses worden uitgevoerd. Is de analyse klaar, dan breken we de brug af. Je houdt controle over je eigen data: anderen kunnen die niet inzien en niet kopiëren, maar wel gebruiken. Dit zorgt voor veel sterkere privacy-garanties ten opzichte van bestaande technieken.”

Aan het woord is Roderick Rodenburg, CEO van Roseman Labs. Een ambitieus bedrijf dat pioniert met privacy-verbeterende technieken die het samenbrengen en analyseren van gezondheidsdata veilig mogelijk maken. Dankzij een recent geformaliseerde samenwerking met IQVIA  - wereldwijde leider in zorgkennis, data, geavanceerde analyses, technologie-oplossingen en klinisch onderzoek - kunnen grote stappen worden gezet. 

“Ons zorglandschap is enorm versnipperd”, aldus Martijn Nap, algemeen directeur van IQVIA Nederland. “Een heel nieuw datasysteem opzetten, is een utopie. De oplossing zit in het veilig verbinden van data, zonder de privacy van patiënten in gevaar te brengen. We moeten bronnen combineren: ziekenhuizen, huisartsen, het CBS. Dán kunnen we leren en de zorg beter en efficiënter maken.” 

Details behouden
MPC maakt het mogelijk om van gecentraliseerde data naar virtueel gekoppelde data te gaan, schetst Rodenburg: “We versleutelen data aan de bron en splitsen die op. Vervolgens voeren we op meerdere computers deelanalyses uit, die dan samen worden gebracht. Alternatief is dat je alle data samenbrengt op één centrale plek. Maar dan moet je pseudonimiseren om de gegevens te beschermen, waardoor veel details verloren gaan. Bovendien moet je dan data delen of kopiëren.”

Met MPC blijft alle informatie tot in detail behouden, zonder data te delen. De eigenaar van een databron houdt volledig grip op wat er met diens data gebeurt. “Jouw data kunnen nooit worden gekopieerd en geplakt en je kunt op ieder moment de knop uitzetten”, vervolgt Rodenburg. “Dan stopt de databrug en is ook historisch alles weg. Bovendien kunnen we bewijzen dat voor alle deelberekeningen onder water, niets onthuld wordt over de brondata. Die zijn heel krachtig beschermd.” 

Hoewel MPC niet nieuw is, heeft Roseman Labs de techniek zodanig krachtig geïmplementeerd, dat er veel sneller dan voorheen, veel meer data veilig kunnen worden verwerkt. Dit zorgt ervoor dat de maximale omvang van datasets die verwerkt kunnen worden, gestegen is van enkele tienduizenden records naar honderden miljoenen records. Daardoor is de techniek inzetbaar geworden voor praktische toepassingen.

“Er wordt nu ook veel gesproken over federated data analysis”, vertelt Everdien Derksen, Director Healthcare bij IQVIA. “Er is dan geen centrale database, alleen de analyses worden gedeeld. MPC gaat echter een stap verder qua privacy, omdat de data volledig versleuteld worden aan de basis.” 

Freya de Mink, Business Development and Healthcare Lead bij Roseman Labs, wijst op nog een ander voordeel: “Bij federated analysis moet iedere bron de gegevens in precies dezelfde structuur hebben klaar staan. Dus je kunt slechts een bepaald type analyses doen. Bij MPC is dat niet nodig.” 

Leren van bestaande zorgdata
“Er is in de zorg op dit moment veel behoefte aan leren van bestaande zorgdata”, aldus Nap. “Data dus die niet voortkomen uit wetenschappelijk onderzoek in te traditionele zin. Het gaat dan om: wat kunnen we leren van patiënten die in de praktijk worden behandeld, in plaats van in studieverband? Daar kunnen wij als IQVIA een enorme bijdrage aan leveren.”

Met CTcue - een privacy-by-design technologie - biedt IQVIA ziekenhuizen de mogelijkheid om data eenduidig te ontsluiten en analyseren. Hiermee kunnen zorgprofessionals ook uit ongestructureerde data inzichten halen, zoals uit vrije tekstvelden. Bovendien kunnen ziekenhuizen hun data zodanig voorsorteren, dat ze met dezelfde dataset op meerdere niveaus - met andere instellingen samen - analyses kunnen uitvoeren via MPC. 

Derksen stelt dat dit enorm veel administratielast scheelt. Nap voegt toe dat CTcue en MPC gegevens binnen de individuele ziekenhuizen ontsloten kunnen worden, om ze vervolgens veilig aan elkaar koppelen om te benchmarken. “Dat noemen wij de horizontale verbinding. Maar we willen graag ook verticale verbindingen leggen: tussen data van het ziekenhuis en die van een andere bron. Van een huisarts bijvoorbeeld, een apotheek of een heel andere database zoals die van een pathologisch lab. Daar lopen nu een paar concrete projecten voor. Ik denk dat de toekomst vooral zit in verticale analyses.”

Ook de patiënt kan een belangrijke databron zijn. “De echt grote volumecijfers zitten bij niet-voorgeschreven middelen zoals vitaminepreparaten en pijnstillers”, aldus Nap. “Ook het gebruik daarvan brengen wij in kaart. Belangrijk, want artsen willen dolgraag weten wat patiënten zelf gebruiken en de patiënt wil weten: doe ik hier nu wel of niet goed aan? Als patiënten die informatie vrijwillig kunnen delen met de specialist, dan kan je misschien wel nieuwe dingen uitvinden. Wat als de drogist ook een databron zou zijn? En de niet-reguliere geneeskunde? Of een app die bijhoudt hoeveel je beweegt en hoe je slaapt?”

Groter gaan denken
Door de vooruitgang op technologisch vlak en de samenwerking tussen IQVIA en Roseman Labs zien de samenwerkingspartners een verschuiving plaatsvinden. Het onderscheid tussen primaire en secundaire data wordt minder scherp. De Mink: “We krijgen steeds meer onderzoeksvragen van zorginstellingen die dicht op het primaire proces zitten. Met onze technologie kunnen we gegevens uit EPD’s halen en daarmee de muur tussen primair en secundair gebruik van data doorbreken. Dat betekent dat ziekenhuizen bijvoorbeeld vragen over het managen van capaciteit op regioniveau, samen kunnen oppakken.”

Nap voegt toe: “Door het vervagen van de grens tussen primair en secundair gebruik, bewegen we steeds meer toe naar ‘meervoudig datagebruik’. Een situatie waarin behandelaren continu leren van iedere nieuwe patiënt. We kunnen steeds meer nieuwe inzichten genereren, die tot voor kort ondenkbaar waren. Daarom dachten veel zorginstellingen niet eens na over wat ze wilden weten, omdat het toch niet kon. Maar nu kan heel veel wel. Bijvoorbeeld de gegevens van een ziekenhuis, huisarts en CBS koppelen, zodat we een patiënt vanaf de eerste klacht tot en met overlijden - wat niet altijd in het ziekenhuis gebeurt - kunnen volgen. Zo kan je de effecten van behandelingen op de lange termijn veel beter in kaart brengen.” 

‘Denk groot’ is kortom het devies. Rodenburg: “We hebben het hier echt over een paradigmaverandering. Van een situatie waarin de enige manier is om data naar elkaar te sturen, naar een situatie waarin je data koppelt zonder te delen. De berekening reist nu rond, niet de data. En dat op basis van een techniek met de beste garanties als het gaat om bescherming van privacy.” 

Organisatie-overstijgende data-analyse: de opties

Als het gaat om het analyseren van data uit meerdere bronnen, zijn er grofweg drie opties:

  1. Je deelt alleen gemiddeldes of geaggregeerde data. Heel veilig en anoniem, maar je verliest detailniveau. 
  2. Je deelt alles in een centrale database. Dan kan je analyseren tot op detail, maar verlies je controle over de data.
  3. Je versleutelt de data aan de bron, splitst data op en voert deelanalyses uit (MPC). Dit levert zowel detailanalyses als volledige datacontrole op.