Een van de ontwikkelingen die een vroege diagnose van kanker mogelijk maken is het met behulp van AI-tools analyseren van medische scans. Voordat de betreffende AI-tools hiervoor geschikt zijn, moeten ze getraind worden met grote hoeveelheden zorgvuldig gelabelde gegevens om consistente en nauwkeurige resultaten te behalen. Dat houdt in dat radiologen nog steeds veel tijd moeten besteden aan het annoteren van medische beelden. Een internationaal onderzoeksteam heeft hiervoor mogelijk een oplossing bedacht, de zogenaamde AbdomenAtlas. Dit is de grootste abdominale CT-dataset ooit, met meer dan 45.000 3D CT-scans van 142 geannoteerde anatomische structuren, afkomstig van 145 ziekenhuizen wereldwijd.
Eerdere datasets van abdominale organen werden samengesteld door radiologen die handmatig individuele organen identificeerden en labelden op CT-scans, wat duizenden uren aan menselijke arbeid kostte. “Voor het annoteren van 45.000 CT-scans met 6 miljoen anatomische vormen zou een deskundige radioloog bijna 2500 jaar onafgebroken hebben moeten werken”, vertelt hoofdauteur Zongwei Zhou, assistent-onderzoekswetenschapper aan de Whiting School of Engineering's Department of Computer Science.
Labelen met AI-algoritmen
Om deze uitdaging aan te gaan, maakte het team, onder leiding van Johns Hopkins Bloomberg Distinguished Professor Alan Yuille, AI-algoritmen waarmee de taak van het labelen van organen drastisch versneld kon worden. In samenwerking met 12 deskundige radiologen en extra medische stagiairs konden zij dit project in minder dan twee jaar te voltooien.
De methode van de onderzoekers combineert drie AI-modellen die zijn getraind op openbare datasets van gelabelde abdominale scans om annotaties te voorspellen voor ongelabelde datasets. Met behulp van kleurgecodeerde aandachtskaarten, om gebieden die verfijning behoeven te markeren, identificeert de methode de meest kritieke delen van de voorspellingen van de modellen voor handmatige beoordeling door radiologen. Door dit proces te herhalen – de AI-gedreven voorspelling, gevolgd door menselijke beoordeling – wordt het annotatieproces aanzienlijk versneld. Volgens de onderzoekers resulteert dit in een 10-voudige versnelling voor tumoren en een 500-voudige voor organen.
Een mooi voorbeeld van de meerwaarde die AI-tools kunnen bieden voor het in kaart brengen van risico's en het versnellen van de beoordeling en diagnostiek van, in dit geval borstkanker, is de in 2022 gestartte ontwikkeling van een AI-model, gebaseerd op historische data. Doel daarvan was het in kaart brengen van uitzaaiingen die jaren later optreden en nu nog niet worden vastgelegd, maar ook het beter voorspellen van de kans dat een patiënt met uitzaaiingen te maken krijgt.
Radiologen ontlasten
Deze aanpak stelt het team in staat om de omvang, schaal en precisie van hun dataset uit te breiden zonder radiologen te overbelasten, wat resulteert in wat volgens het team de grootste volledig geannoteerde abdominale orgaan dataset is die er bestaat. Ze blijven meer scans, organen en zowel echte als kunstmatige tumoren toevoegen om nieuwe en bestaande AI-modellen te trainen in het identificeren van kankergezwellen, het diagnosticeren van ziekten en zelfs het maken van digitale tweelingen van patiënten.
“Door AI-modellen in staat te stellen meer te leren over gerelateerde anatomische structuren voordat ze worden getraind op domeinen met beperkte gegevens, zoals tumoridentificatie, hebben we ervoor gezorgd dat AI in sommige tumordetectietaken vergelijkbaar presteert met de gemiddelde radioloog,” meldt eerste auteur Wenxuan Li, een afgestudeerde student computerwetenschappen die wordt geadviseerd door Yuille.
‘Open source’ benchmark
AbdomenAtlas is volgens de onderzoekers als een benchmark waarmee andere onderzoeksgroepen de nauwkeurigheid van hun medische segmentatiealgoritmen kunnen evalueren. Hoe meer gegevens er worden gebruikt om deze algoritmen te testen, hoe beter hun betrouwbaarheid en prestaties kunnen worden gegarandeerd in complexe klinische scenario's, aldus de Hopkins-onderzoekers.
Het team heeft toegezegd AbdomenAtlas uiteindelijk vrij te geven voor het publiek en nieuwe medische segmentatie-uitdagingen aan te gaan, zoals de BodyMaps-uitdaging op de 27e Internationale Conferentie over Medical Image Computing en Computer Assisted Intervention afgelopen oktober. Deze uitdaging was bedoeld om AI-algoritmen aan te moedigen die niet alleen theoretisch goed presteren, maar ook praktisch efficiënt en betrouwbaar zijn in klinische omgevingen.
Ondanks de vooruitgang die mogelijk is gemaakt door AbdomenAtlas, merken de makers op dat de dataset slechts 0,05% uitmaakt van de CT-scans die jaarlijks in de Verenigde Staten worden gemaakt, en ze roepen andere instellingen op om te helpen de gaten op te vullen. “Samenwerking tussen instellingen is cruciaal voor het versnellen van het delen van gegevens, annotatie en AI-ontwikkeling. We hopen dat onze AbdomenAtlas de weg kan bereiden voor grootschaligere klinische onderzoeken en uitzonderlijke mogelijkheden kan bieden aan beoefenaars in de medische beeldvormingsgemeenschap”, aldus de onderzoekers.