Duits onderzoek naar AI-gegenereerde doktersbrieven

do 3 oktober 2024 - 16:10
AI
Nieuws

Er is veel te doen over het gebruik van generatieve AI-tools in de gezondheidszorg. Bij de Universiteit van Freiburg is onderzoek gedaan naar het inzetten van GenAI voor het schrijven van doktersbrieven. De resultaten van dat onderzoek zijn zeer goed te noemen. Meer dan negen op de tien (93%) van de net AI gegenereerde medische documentatie voor de doktersbrieven bleken slechts minimale aanpassingen nodig te hebben om in de praktijk gebruikt te kunnen worden.

Die laatste conclusie benadrukt meteen een belangrijke voorwaarde voor het gebruik van met behulp van generatieve AI gegenereerde medische documentatie: controle is cruciaal. Eerder berichtten wij nog over een ander onderzoek dat aantoonde dat GenAI-tools zoals ChatGPT die ingezet worden door zorgverleners soms verkeerde adviezen genereren.

Administratielast verlichten

Het Duitse onderzoek richtte zich op het inzetten van generatieve AI voor het geautomatiseerd maken van medische (gespreks)verslagen. Vergelijkbaar met Dragon Medical One, de generatieve AI-oplossing zoals die al geruime tijd door Microsoft/Nuance wordt aangeboden en waarmee ook goede resultaten behaald worden als het gaat om het verlichten van de administratieve last van artsen.

In de Duitse studie van onder andere Felix Heilmeyer, onderzoeker bij het Institute for Digitalization in Medicine, werden 90.000 klinische documenten van de afdeling Oftalmologie van het Freiburg Medical Center gebruikt om de AI-modellen te trainen. Vervolgens genereerde verschillende taalmodellen op basis hiervan doktersbrieven, die vervolgens door medische professionals werden geëvalueerd.

Meer dan 93% geschikt

Die evaluaties toonden aan dat met het Duitse BLOOM-CLP model 93,1 procent van de gegenereerde documenten, na hooguit wat kleine correcties, geschikt was voor klinisch gebruik. Naast de keuze van het geschikte model benadrukken de onderzoekers dat de aanpassing ervan aan het betreffende taalgebied een doorslaggevende rol speelt bij de geschiktheid ervan voor praktisch gebruik.

De grootste uitdaging van de studie was om ervoor te zorgen dat de documenten die door het taalmodel werden gegenereerd, voldeden aan de hoge normen voor medische documentatie in het Duits. "Het aanpassen aan specifieke medische terminologie en de structuur van klinische rapporten was een bijzonder veeleisende taak, omdat het model teksten moest leveren die zowel nauwkeurig als begrijpelijk waren", aldus de onderzoekers.

"Onze resultaten laten zien dat modellen die speciaal zijn getraind voor de Duitse taal waardevolle ondersteuning kunnen bieden bij het maken van medische rapporten. Dit zou de workflows in de dagelijkse klinische praktijk aanzienlijk kunnen vereenvoudigen", zegt onderzoeksleider Dr. Christian Haverkamp, waarnemend directeur van het Instituut voor Digitalisering in de Geneeskunde van het Medisch Centrum van de Universiteit van Freiburg. Het onderzoek is gepubliceerd in het tijdschrift JMIR Medical Informatics.