Met behulp van machine learning technologie genaamd federated learning is het mogelijk om het vinden van hersentumoren met een derde te verbeteren. Dat blijkt uit Amerikaans onderzoek van Intel Labs en de Perelman School of Medicine van de Universiteit van Pennsylvania (Penn Medicine). Het Erasmus MC in Rotterdam was bij de studie betrokken. Het gaat volgens de onderzoekers om de grootste medische federated learning studie tot nu toe, waarbij een wereldwijde dataset van 71 instellingen op zes continenten werd onderzocht.
In 2020 kondigden Intel en Penn Medicine een overeenkomst aan om samen te werken en federated learning te gebruiken om tumordetectie te verbeteren en de behandelingsresultaten te verbeteren van een zeldzame vorm van kanker - glioblastoma (GBM). Dit is de meest voorkomende en dodelijke hersentumor bij volwassenen, met een mediane overleving van slechts 14 maanden na standaardbehandeling.
Hoewel de behandelingsmogelijkheden de afgelopen 20 jaar zijn uitgebreid, is de totale overleving niet verbeterd. Het onderzoek werd gefinancierd door het Informatics Technology for Cancer Research programma van het National Cancer Institute van de National Institutes of Health.
Toegang tot medische data
Om de behandeling van ziekten te verbeteren, moeten onderzoekers toegang krijgen tot grote hoeveelheden medische data - in de meeste gevallen datasets die de drempel overschrijden die één instelling kan produceren. Het onderzoek toont de effectiviteit aan van federated learning op schaal en de potentiële voordelen die de gezondheidszorg kan realiseren wanneer multisite datasilo's worden ontsloten. Voordelen zijn onder meer vroege opsporing van ziekten, wat de kwaliteit van leven kan verbeteren of de levensduur van een patiënt kan verlengen.
De toegankelijkheid van data is echter al lang een probleem in de gezondheidszorg vanwege nationale wetten inzake databescherming, zoals in Nederland de Algemene verordering gegevensbescherming (AVG). Hierdoor was het bijna onmogelijk om medisch onderzoek en gegevensuitwisseling op grote schaal te realiseren zonder de gezondheidsinformatie van patiënten in gevaar te brengen. Intel's federated learning-hardware en software voldoen naar eigen zeggen aan de eisen van dataprivacy en beschermen data-integriteit, privacy en veiligheid door middel van vertrouwelijk computergebruik.
Potentieel federated learning
"Federated learning heeft een enorm potentieel in tal van domeinen, met name in de gezondheidszorg, zoals blijkt uit ons onderzoek met Penn Medicine", stelt Jason Martin, hoofdingenieur, Intel Labs."Het vermogen om gevoelige informatie en data te beschermen opent de deur voor toekomstige studies en samenwerking, vooral in gevallen waarin datasets anders ontoegankelijk zouden zijn. Ons werk met Penn Medicine heeft het potentieel om patiënten over de hele wereld positief te beïnvloeden en we kijken ernaar uit om de belofte van federated learning verder te onderzoeken."
Het Penn Medicine-Intel resultaat werd bereikt door het verwerken van grote hoeveelheden gegevens in een gedecentraliseerd systeem. Dit gebeurde met behulp van Intel federated learning technologie in combinatie met Intel Software Guard Extensions (SGX). Deze technologie neemt barrières weg voor het delen van data die in het verleden samenwerking bij soortgelijk kanker- en ziekteonderzoek in de weg stonden. Het systeem pakt tal van problemen met dataprivacy aan door de ruwe data binnen het eigen ziekenhuisnetwerk te houden en alleen toe te staan dat modelupdates, die op basis van die gegevens zijn berekend, naar een centrale server of aggregator worden gestuurd, en niet de ruwe data.
Controle houden over data
Het Erasmus MC werkt sinds 2020 mee aan de studie. Radioloog prof. dr. Smits en biomedisch onderzoeker dr. Van der Voort van het Erasmus MC, stelt dat het umc door de federated learning studie kon bijdragen aan het verbeteren van automatische tumordetectie, zonder daarvoor patiëntgegevens te hoeven versturen. "Automatische tumordetectie is een belangrijke stap voor het personaliseren en opvolgen van een behandeling, en om deze methodologie te ontwikkelen is het essentieel om data vanuit veel verschillende instituten te gebruiken. Met deze samenwerking hebben we dat eenvoudig kunnen doen, terwijl we wel zelf de controle konden houden over onze data.”
Federated learning biedt een doorbraak in het waarborgen van veilige multi-institutionele samenwerkingen, stelt senior auteur Spyridon Bakas, PhD, assistent-professor Pathologie & Laboratoriumgeneeskunde, en Radiologie, aan de Perelman School of Medicine van de Universiteit van Pennsylvania. "Het maakt de toegang tot de grootste en meest diverse dataset mogelijk die ooit in de literatuur is gezien. En dat terwijl alle data te allen tijde binnen elke instelling zelf worden bewaard. Hoe meer data we kunnen invoeren in modellen voor machine learning, hoe nauwkeuriger ze worden. Dat zal op zijn beurt ons vermogen verbeteren om zelfs zeldzame ziekten, zoals glioblastoom, te begrijpen en te behandelen."
De resultaten van het Penn Medicine-Intel Labs onderzoek zijn gepubliceerd in het peer-reviewed tijdschrift, Nature Communications.