AI? Eerst FHIR, SNOMED, kwaliteit en vooringenomenheid bespreken

ma 5 mei 2025 - 15:00
AI
Nieuws

“LLM's zijn nog niet in staat om interoperabiliteitsuitdagingen aan te gaan als het gaat om het structureren van ongestructureerde tekst in gestandaardiseerde medische terminologie,” zegt Dr. Carina Vorisek, enthousiasteling op het gebied van digitale gezondheid bij het Berlin Institute of Health en een medische informatica-expert die zich richt op het bouwen van AI-ready, interoperabele gezondheidssystemen. In ons gesprek verkennen we gegevensstandaarden, AI in de geneeskunde en alles daartussenin.

De gezondheidszorg staat te popelen om AI in te voeren, maar veel systemen worstelen nog steeds met de interoperabiliteit van basisgegevens. Hoe realistisch is het volgens u om AI op grote schaal toe te passen zonder eerst deze interoperabiliteitsproblemen op te lossen?

Interoperabiliteit is essentieel voor een zinvolle en veilige toepassing van AI in de gezondheidszorg. Op dit moment worden de meeste AI-toepassingen die ik ben tegengekomen in silo's ontwikkeld en ingezet binnen individuele instellingen. In een enquête die we hebben gehouden onder AI-ontwikkelaars gaf de meerderheid aan te werken met beeldvormingsgegevens van slechts één instelling. Dat is zeer problematisch: AI-modellen die in zo'n beperkte omgeving zijn getraind, kunnen niet veilig generaliseren naar diverse patiëntenpopulaties. Beeldvorming wordt vaak gekozen omdat het relatief gestandaardiseerd is via formaten als DICOM.

Maar als het gaat om tekstuele of gestructureerde klinische gegevens, zoals diagnoses, procedures of labresultaten, hebben we te maken met een veel grotere versnippering. Ook al bestaan er internationale standaarden zoals SNOMED, veel systemen vertrouwen nog steeds op bedrijfseigen codes of vrije tekst, wat gegevensuitwisseling en AI-integratie extreem moeilijk maakt.

Toen ik in een academisch ziekenhuis werkte op de afdeling OB/GYN (redactie: Verloskunde en Gynaecologie), moest ik zeven verschillende IT-systemen gebruiken binnen dezelfde afdeling. Dat is een duidelijk voorbeeld van hoe gefragmenteerd onze infrastructuur is. Als AI echte waarde wil leveren, of het nu gaat om ondersteuning van klinische beslissingen of voorspellende analyses, dan moet het toegang hebben tot interoperabele gegevens uit verschillende systemen.

U hebt veel gewerkt met standaarden zoals FHIR en SNOMED. Welke datastandaarden zijn volgens u het meest veelbelovend voor een echt interoperabele gezondheidszorg en welke praktische stappen zouden de wereldwijde implementatie ervan versnellen?

Ik denk dat FHIR en SNOMED de sterkste basis bieden voor echt interoperabele gezondheidszorg. FHIR is flexibel genoeg om in veel verschillende zorgomgevingen te werken, wat essentieel is omdat een te strikte standaard eenvoudigweg niet bruikbaar is in de echte zorg. Tegelijkertijd stelt FHIR ons nog steeds in staat om gegevens te structureren terwijl het ruimte laat voor de vrije tekst notities die zo gebruikelijk zijn in de klinische praktijk.

SNOMED is vooral krachtig omdat het meer dan 360.000 medische concepten bevat, waardoor medische informatie zeer gedetailleerd en nauwkeurig kan worden vastgelegd. Dat detailniveau is essentieel als we gegevens effectief willen gebruiken voor onderzoek, AI of gepersonaliseerde zorg. Ter vergelijking, systemen zoals ICD-10 waren voornamelijk ontworpen voor facturering en omvatten slechts een beperkt aantal aandoeningen, hoewel ICD-11 een grote stap voorwaarts is met ongeveer 85.000 items.

Om het wereldwijde gebruik van deze standaarden te ondersteunen, moeten we echte prikkels creëren - bijvoorbeeld financiële prikkels - om ze in te voeren.

Welke lessen hebt u geleerd tijdens uw verblijf aan het Boston Children's Hospital en de Harvard Medical School over het snijvlak van translationele geneeskunde, digitale innovatie en kunstmatige intelligentie? Hoe kunnen deze inzichten in Europa worden toegepast?

Mijn tijd in Boston heeft mijn kijk op de gezondheidszorg veranderd. Voorheen had ik een erg klinische manier van denken over geneeskunde. Maar als je innovatief wilt zijn, is er zoveel meer om rekening mee te houden: Er zijn medische gegevens, je moet begrijpen hoe die worden verzameld, geanalyseerd en gerapporteerd. Dan is er de technologische vooruitgang, dus je moet ook begrijpen welke handmatige taken door technologie kunnen worden vervangen en welke gebruikssituaties in de geneeskunde echt kunnen profiteren van AI en digitale hulpmiddelen.

Voor mij bevindt digitale gezondheid zich op het kruispunt van al deze gebieden. En alle belanghebbenden, vooral patiënten en artsen, die vaak buitengesloten worden, moeten deel uitmaken van het gesprek om zinvolle innovatie te stimuleren.

Een belangrijke les was de nauwe betrokkenheid van artsen bij onderzoek. We hadden wekelijkse bijeenkomsten waar artsen lopende onderzoeksprojecten kritisch evalueerden en ervoor zorgden dat ze in lijn bleven met de praktische klinische behoeften. In Duitsland zie ik een enorme scheiding tussen onderzoek en klinische praktijk, waardoor veel goede ideeën nooit bij patiënten terechtkomen. We hebben betere structuren nodig om klinisch werk en onderzoek te combineren, zoals medische informatica-opleidingen, om artsen in staat te stellen innovatie vorm te geven terwijl ze patiënten kunnen blijven verzorgen.

Een andere belangrijke ervaring was de nauwe samenwerking tussen onderzoek en industrie. In Duitsland werken onderzoek en industrie vaak in silo's. Om dat te veranderen hebben we carrièrepaden nodig. Om dat te veranderen, hebben we carrièrepaden nodig die professionals in staat stellen om tussen beide gebieden te bewegen. Op dit moment is het echter vaak óf onderzoek óf de industrie wat de samenwerking beperkt en de vooruitgang vertraagt.

Er is een gezegde in AI: Garbage in, garbage out. Vindt u het, gezien de realiteit van inconsistente of kwalitatief slechte medische gegevens, verantwoord om AI in te zetten in klinische omgevingen voordat deze kwaliteitsproblemen zijn opgelost?

Hier ben ik zeker beïnvloed door mijn tijd in de VS, waar de mentaliteit meer is: laten we het gewoon doen. Er is ongelooflijke technologie beschikbaar en tegelijkertijd staan we in de gezondheidszorg voor veel uitdagingen die met digitale hulpmiddelen zouden kunnen worden opgelost. Het zou dus zonde zijn om AI niet te gebruiken, alleen omdat de gegevens nog niet perfect zijn.

Dat gezegd hebbende, hebben we absoluut de verantwoordelijkheid om de kwaliteit van gegevens zoveel mogelijk te verbeteren. We moeten gegevens verzamelen die de hele bevolking vertegenwoordigen, niet alleen blanke mannen, en internationale standaarden implementeren om interoperabiliteit te garanderen. We hebben ook open gesprekken en voorlichting nodig over bias, risico's en AI-beperkingen bij klinisch gebruik.

Natuurlijk moet geneeskunde in handen blijven van professionals in de gezondheidszorg. Maar AI kan een krachtig hulpmiddel zijn, niet alleen voor artsen maar ook voor verpleegkundigen, zorgverleners en patiënten om de resultaten en het welzijn te verbeteren.

Vanuit uw perspectief als arts en onderzoeker, hoe volwassen zijn de huidige AI-modellen als het gaat om het ondersteunen van klinische besluitvorming in de echte wereld, vooral op het gebied van bijvoorbeeld vrouwengeneeskunde?

Als arts zou ik zeggen dat de huidige AI-modellen nog erg onvolwassen zijn als het gaat om klinische besluitvorming in de echte wereld, vooral als ik vergelijk wat ik zie in ziekenhuizen met de technologische vooruitgang buiten klinische omgevingen. Als onderzoeker heb ik daarentegen het gevoel dat we enorme vooruitgang hebben geboekt. Vooral in Duitsland hebben we krachtige algoritmen en veelbelovende AI-systemen, maar wat ontbreekt is de echte infrastructuur om ze daadwerkelijk in de zorg te implementeren.

Op het gebied van de gezondheid van vrouwen lopen we nog verder achter. Het ontbreekt ons nog steeds aan innovatie op dit gebied, en wat nog zorgwekkender is, we hebben onvoldoende gegevens over vrouwen in de geneeskunde. Dit brengt ernstige risico's met zich mee bij het toepassen van AI, omdat modellen die voornamelijk zijn getraind op mannelijke gegevens mogelijk niet veilig of effectief zijn voor vrouwen.

Tegelijkertijd is het potentieel van AI om de gezondheid van vrouwen te verbeteren enorm. We zouden AI bijvoorbeeld kunnen gebruiken om historische klinische onderzoeken die vrouwen uitsluiten of ondervertegenwoordigen opnieuw te analyseren. Daarom moeten we het verzamelen van gegevens over de gezondheid van vrouwen in alle levensfasen ondersteunen door onderzoek te financieren, door vrouwen geleide startups aan te moedigen en door structurele barrières aan te pakken, zoals kinderopvang, die vrouwen ervan weerhouden deel te nemen aan klinische studies. Het allerbelangrijkste is dat we alle belanghebbenden - clinici, onderzoekers, ontwikkelaars - voorlichten over het belang van inclusieve data als we willen dat AI echt betere gezondheidsresultaten voor iedereen oplevert.

Grote taalmodellen, zoals GPT, kunnen ongestructureerde medische teksten analyseren. Zou hun vermogen om met ongestructureerde gegevens te werken de interoperabiliteitsproblemen kunnen verlichten, of zouden ze in plaats daarvan onderliggende problemen met de gegevenskwaliteit kunnen maskeren?

Ik krijg deze vraag vaak en eerlijk gezegd is er nog niet veel solide literatuur over. Het is iets dat echt verder moet worden onderzocht. We hebben onlangs bijvoorbeeld onderzocht hoe LLM's het coderen van medische termen naar SNOMED kunnen ondersteunen. De resultaten waren nogal onbevredigend, wat de voortdurende behoefte aan gespecialiseerde codeurs bevestigde. Op dit moment zijn LLM's dus niet in staat om interoperabiliteitsproblemen aan te pakken als het gaat om het structureren van ongestructureerde tekst naar gestandaardiseerde medische terminologie.

Toch zou het geweldig zijn als AI interoperabiliteitstaken zou kunnen ondersteunen. Ze zijn tijdrovend en arbeidsintensief. Maar op dit moment kunnen we daar niet op vertrouwen.

Ik zie mogelijkheden in het gebruik van LLM's om de enorme hoeveelheid vrije tekstdocumentatie in gezondheidszorgsystemen te helpen verwerken. Dat zou wel eens de meest veelbelovende weg vooruit kunnen zijn, aangezien er in de geneeskunde altijd vrije tekst zal zijn. Idealiter hebben we een hybride aanpak: delen van de gegevens gecodeerd met medische terminologie en delen verwerkt door LLM's.

Natuurlijk moeten we altijd streven naar het maximaliseren van de hoeveelheid gestructureerde, hoogwaardige en goed gedefinieerde gegevens. Gestructureerde gegevens blijven veel betrouwbaarder dan vrije tekst of eigen formaten, vooral als we een consistent en veilig gebruik in de gezondheidszorg willen garanderen.

Wat is de meest kritieke verschuiving die nodig is, technisch of cultureel, voor gezondheidszorgsystemen om volledig rechtvaardige, AI-gedreven en evidence-based digitale gezondheidsoplossingen te realiseren?

De meest kritieke verschuiving die we nodig hebben is een culturele: als samenleving moeten we de waarde van het delen van gegevens erkennen, niet alleen voor individuele zorg, maar voor het collectieve belang. Zodra we die mentaliteit omarmen, kunnen we verder gaan en ons gezondheidszorgsysteem omvormen tot een systeem dat rechtvaardiger, efficiënter en echt innovatief is.

Wat baart u de meeste zorgen over de huidige ontwikkeling van AI in de gezondheidszorg?

Wat mij de meeste zorgen baart, is dat het niet snel genoeg gaat. We hebben de tools, de kennis en het potentieel, maar we gebruiken ze niet in de klinische praktijk. We moeten overgaan tot implementatie. Aan de slag!