Met behulp van machine learning-technologie genaamd federated learning is het mogelijk om het vinden van hersentumoren met een derde te verbeteren. Dat was de conclusie vorig jaar december van een Amerikaans onderzoek van Intel Labs en de Perelman School of Medicine van de Universiteit van Pennsylvania (Penn Medicine). Het Erasmus MC in Rotterdam was bij de in 2020 opgestarte studie betrokken. In ICT&health vertellen twee onderzoekers – neuroradioloog prof. Marion Smits en biomedisch onderzoeker dr. Sebastian van der Voort – over de positieve impact die federated learning kan hebben op grootschalige onderzoeken.
Federated learning, waarbij volgens FAIR-principes toepassingen naar de data gaan in plaats van andersom, was nog onontgonnen terrein voor het Erasmus MC. Reden om in 2020 aan te haken bij een grootschalig internationaal onderzoek naar in welke mate federated learning kan bijdragen aan AI-gebaseerde medisch wetenschappelijke onderzoeken.
Neuroradioloog en hoogleraar in de neuroradiologie Marion Smits kende de hoofdonderzoeker van de Penn-studie, Spyridon Bakas, onder meer van een gezamenlijk consortium dat op diverse manieren probeert om hersentumoren in kaart te brengen (voor het onderzoeksdeel van Smits’ functies ligt de focus op hersentumoren). “Toen Bakas twee jaar geleden het federated learning onderzoek naar deze tumoren aan het opzetten was, heeft hij ook ons erbij gevraagd”, vertelt Smits.
Inmiddels zie je meer onderzoeken waarin federated learning wordt meegenomen, maar toen het Erasmus MC ermee begon, was het nog nieuw, voegt biomedisch onderzoeker Sebastian van der Voort (actief in de onderzoeksgroep van Smits) toe. Zijn focus bij zijn promotieonderzoek lag op de toepassing van AI-technologie om informatie over mogelijke hersentumoren te verkrijgen die je normaal via biopten zou krijgen.
Voordelen federated learning
Toegang tot grote datasets is vaak een belangrijk probleem voor medisch onderzoekers, vooral wegens privacy-regels. Op zichzelf levert federated learning volgens Van der Voort niet toegang tot meer data op. Maar omdat iedereen de data in eigen beheer kan houden, is men eerder genegen om toegang tot hun data te geven. “Ze hoeven die data niet meer uit handen te geven, wat toch altijd privacygevoelig is, maar kunnen een AI-toepassing onder hun controle op de eigen data zetten. Zo wordt toegang tot data veel eenvoudiger.”
Vaak is data ook beperkt toegankelijk omdat het oudere data betreft, zeker bij zeldzaam voorkomende tumoren. Tegenwoordig is het vrij normaal om mensen ook toestemming te vragen bij het gebruik van data voor medisch-wetenschappelijk onderzoek, maar dat is niet altijd zo geweest”, voegt Smits toe. “Niet verkregen toestemming om data te mogen delen is minder een probleem wanneer die gegevens de eigen servers niet verlaten. Federated learning omzeilt zo het probleem dat privacy-regulering soms betekent.”
Bijzondere uitkomsten
Wie het onderzoeksartikel leest over de studie, realiseert zich misschien niet meteen hoe bijzonder de uitkomsten zijn, weet Smits. “Het klinkt logisch, dat we een robuust, generaliserende AI-toepassing hebben ontwikkeld. Maar het is wel bijzonder, want het lukt vaak zat niet. Er hebben 71 centra deelgenomen, wat zowel heel veel als hele diverse data heeft opgeleverd. Zij hebben allemaal geleerd hoe je een federated learning-omgeving kunt opzetten. Dit soort datasets zijn echt de toekomst, niet langer de zelf verzamelde datasets met het zelf ontwikkelde algoritme dat dan de wereld in wordt gestuurd. Federated learning zet een nieuwe standaard."
Lees het uitgebreide interview met Marion Smits en Sebastiaan van der Voort in editie 1 van ICT&health, die op 17 februari verschijnt.