NLP als basis voor population health

wo 21 augustus 2024
NLP als basis voor population health
Data
Premium

Om de toenemende druk op het zorgstelsel te verlichten, zetten overheid, wetenschap en zorgverleners actief in op preventie. Maar om gerichte preventie te realiseren, is inzicht in sociale determinanten van gezondheid noodzakelijk. Dit inzicht ligt echter veelal verscholen in ongestructureerde vastleggingen in EPD’s. De ontsluiting hiervan vergt de inzet van Natural Language Processing (NLP) technologie. Het samenbrengen van deze inzichten vergroot de mogelijkheden voor population health op regionaal en landelijk niveau.

De onderbouwing van maatschappelijke businesscases voor preventie blijkt met traditionele analyses erg lastig. De huidige gestructureerde data zijn veelal niet fit-for-purpose en geven onvoldoende inzicht in kenmerken van specifieke populaties.

“Om een compleet beeld te krijgen van inwoners heb je data over meerdere domeinen nodig”, zegt Els Roorda, partner bij Q-Consult Zorg en promovendus aan het LUMC. “Niet alleen over zorg, maar ook over sociale determinanten. Het beroep dat iemand uitoefent bijvoorbeeld, of iemands ouders gescheiden zijn, hoe iemands gezondheidsvaardigheden zijn. Dat heeft allemaal invloed op de gezondheid van een populatie.”

Dergelijke data worden vastgelegd in verschillende systemen en de AVG is een hindernis om die te kunnen koppelen. “Dat is een complicerende factor”, zegt Roorda. “Net als het feit dat partijen belangen kunnen hebben om al dan niet te investeren in preventie. En als daarin wel wordt geïnvesteerd, bijvoorbeeld middels de Gezonde Leefstijl Interventie (GLI), dan zijn het vaak de hoogopgeleiden die hiervan gebruik maken. Dat vergroot gezondheidsverschillen juist. Als je problemen hebt om rond te komen, kom je niet toe aan zaken als voldoende bewegen of gezond eten. Omdat bij verschillende populaties verschillende interventies werken, is het belangrijk goed inzicht te hebben in combinaties van persoonskenmerken.”

Effect onzeker

Het effect van preventiemaatregelen aantonen is complex, ziet ook Martijn Roos, principal bij IQVIA. “Dat maakt het voor het ministerie van VWS en voor zorgverzekeraars lastig. Want hoe ga je het geld terugverdienen dat je erin investeert. Toch weet iedereen feitelijk wel dat die investering loont. Probleemgezinnen leveren de samenleving vaak twee ton per jaar aan zorgkosten op, terwijl de onderliggende oorzaak vaak met schulden te maken heeft. Als we dit beter doorgronden, komen we mogelijk tot andere interventies dan zorg. Een extreem voorbeeld wellicht. Maar het helpt wel in de bewustwording om duidelijk te maken waarom het belangrijk is zicht te krijgen op de sociale determinanten.”

Roorda vult aan: “Een ziekenhuis weet niet wat een probleemgezin is. En een gemeente weet niet welke ziekenhuiskosten een probleemgezin maakt. We kijken in silo’s. Het is zaak die data bij elkaar te brengen. Als dat lukt, zit daar al een groot deel van de oplossing.”

Vrije tekst benutten

Het punt is wel: veel waardevolle informatie is niet voldoende beschikbaar vanuit de gestructureerde velden van patiëntendossiers. Veel gestructureerde velden missen namelijk te veel datapunten, waardoor veel beschikbare data alsnog onbruikbaar zijn. 

“Ik schat dat 70 tot 80 procent ervan in de vrije tekst staat”, zegt Marco Spruit, hoogleraar translational data science in population health aan het LUMC. “Je hebt Natural Language Processing ofwel NLP nodig om de essentiële personalized data tevoorschijn te halen en te structureren. Zo gaan we dit binnenkort toepassen op de Health Campus Den Haag, om in opdracht van C-Support uit data van 28.000 patiënten die mensen te detecteren die post-covid hebben gehad. Voor zoiets zijn die vrije teksten een unieke bron.”  

"Je moet bewegen naar de voorkant, naar preventie"

Die data uit vrije velden boven water halen vormt een belangrijke bron om tot voorspellende informatie te komen, meent Roos: “In het EPD wordt bijvoorbeeld niet in een gestructureerd veld vastgelegd of iemand rookt. Maar dat is wel een belangrijke voorspeller voor hart- en vaatziekten. Of neem lage rugklachten. Een klacht waarvoor veel mensen in het ziekenhuis komen, maar waar vaak weinig mee gebeurt. Maar wat als we bijvoorbeeld op basis van CBS-data ook weten wat het beroep is van iemand met lage rugklachten? Mogelijk kunnen we met gerichte interventies beter voorkomen dat mensen onterecht in het ziekenhuis terecht komen.” Hetzelfde geldt voor alcoholconsumptie, vult Spruit aan. “Zulke data wil je in een voorspelmodel hebben.”

Zo zijn veel meer waardevolle voorbeelden te benoemen. Inzicht krijgen in het risico op agressie-incidenten van patiënten in de psychiatrie bijvoorbeeld. “Daarvan kun je pas tot een goed voorspellingsmodel komen als je de dagelijkse verslagen van die patiënten gaat analyseren op agressienuances”, zegt Spruit. Weer een ander voorbeeld betreft voorspellende informatie over therapietrouw als een basis voor persoonsgerichte keuzes in de behandeling.

De rol van CTcue

In de praktijk wordt NLP nog veel te weinig toegepast, stelt Spruit. “In onderzoekssettings wel. Maar als je het naar de praktijk wilt brengen, krijg je direct met de AVG te maken. Daarom is het CTcue privacy-by-design-data-systeem van IQVIA zo waardevol. We hebben hiervan gebruik gemaakt voor een project met het HagaZiekenhuis, om de klinische tekstdata van 148.000 patiënten te abstraheren en analyseren. Met de inzet van AI kunnen we die data gebruiken als voorspeller voor tabaks-, drank- en drugsgebruik.”

De logische vervolgstap is bredere samenwerking om te kunnen opschalen, zodat dit systeem voor grote population health vraagstukken kan worden gebruikt. “CTcue bedient 32 ziekenhuizen”, zegt Spruit. “Dat is voor ons interessant, omdat dit ons een basis geeft om de NLP-technologie breder te gaan toepassen.”

Financiering

Financiering is een hindernis voor het breder toepassen van datagedreven werken in zorgorganisaties, stelt Roorda. “Terwijl ik ervan overtuigd ben dat juist daarin de grote waarde zit om tot succesvolle preventie te komen. Je ziet nu dat het inzetten van bijvoorbeeld NLP stagneert op kennis en capaciteit binnen zorgorganisaties. Maar datagedreven werken kan veel betekenen om de toenemende druk op ons zorgstelsel te verlichten. Zowel in het optimaliseren van de bedrijfsvoering als in het inzetten van passende zorg en preventie. Ik denk dat er een financiële boost nodig is om dat breder inzetten van datagedreven werken binnen organisaties en regio’s te stimuleren. Wellicht zou dit net als e-health ondersteund moeten worden. In de praktijk zie ik dat zeer beperkt.”

Dit is een kwestie van tijd, verwacht Roos. “Meer specifiek van bewustwording over het feit dat in de technologie echt mogelijkheden liggen om stappen te zetten in population health. Maar je hebt gelijk: op dit moment zien het ministerie en de zorgverzekeraars al wel dat hun huidige data niet geschikt zijn om hun doelstellingen op dit gebied te realiseren, maar ze zien nog niet echt hoe dit dan wel kan.” 

Waarbij nog komt, vult Roorda aan, dat de teams in de ziekenhuizen die zich met data bezig houden klein zijn en vaak een backlog hebben van één of twee jaar. “Dit soort initiatieven heeft dan nog geen prioriteit.”

Stapjes zetten

Hoe dan verder? “In kleine stapjes”, zegt Roorda. “En beseffen dat je echt moet leren om datagedreven te werken en samen te werken in populatiegedreven onderzoek.” Roos voegt toe: “Het is een kwestie van samenspel tussen overheid, wetenschap en bedrijfsleven.” Spruit stelt hierop: “De partijen moeten de ruimte krijgen en nemen om transdisciplinair van elkaar te leren. Op onze campus zitten alle partijen hiervoor fysiek bij elkaar, wat uniek is. Dan nog gaat het niet snel, maar we komen er wel.” 

In ieder geval is met deze ontwikkeling een onomkeerbare beweging in gang gezet, is de stellige overtuiging van alle drie. “Gelet op het personeelstekort in de zorg kún je niet blijven focussen op medische behandelingen”, zegt Roorda. “Je moet bewegen naar de voorkant, naar preventie.”

In het Verenigd Koninkrijk is nu bijvoorbeeld fors geïnvesteerd in regionale gezondheid. “Om daarin succesvol stappen te kunnen zetten, is toepassen van NLP-technologie onontkoombaar”, zegt Roos. Hetzelfde zal in Nederland ook gaan gebeuren, voorspelt Spruit. “En dat moet ook wel”, zegt hij afsluitend. “Want als we er niet snel zelf stappen in zetten, doen Microsoft en Google het wel. Dan zijn we de controle erover kwijt en dat moeten we niet laten gebeuren.” 

CV

Els Roorda is partner bij Q-Consult Zorg en promovendus aan het LUMC. 

Marco Spruit is hoogleraar translational data science in population health aan het LUMC .

Martijn Roos is principal bij IQVIA.