Regelmatig lezen we in media dat AI radiologen kan overtreffen bij het herkennen van ziekten zoals kanker. In de praktijk blijkt de impact van kunstmatige intelligentie op de radiologie echter een stuk ingewikkelder te zijn. Een recente studie, uitgevoerd door Harvard Medical School (HMS), Massachusetts Institute of Technology (MIT) en Stanford University toont aan dat het gebruik van AI-assistentie de prestaties van sommige radiologen verbetert, maar bij anderen verslechtert. Deze bevindingen, gepubliceerd in Nature Medicine, werpen een ander licht op de rol die AI in de gezondheidszorg speelt.
Hoewel AI in de gezondheidszorg in het algemeen wordt geprezen vanwege de mogelijkheden om prestaties van clinici te verbeteren, blijkt uit het onderzoek dat dit nog niet zo eenduidig is. Dat komt met name omdat eerder onderzoek zich voornamelijk richtte op de verbetering van de prestaties van radiologen als groep. In de studie wordt echter óók de impact van AI op individuele prestaties grondig onderzocht.
Impact AI op individu
Om de effecten van AI-assistentie te onderzoeken, evalueerden de onderzoekers de prestaties van 140 radiologen over 15 diagnostische taken voor borstkas-röntgenfoto's. In totaal ging het om een set van 324 patiëntcasussen met 15 ziekten. Elke radioloog werd beoordeeld op het vermogen om, met en zonder inzet van AI, klinisch relevante afwijkingen correct te identificeren.
De resultaten laten zien dat de invloed die AI-assistentie heeft per radioloog verschilt. De één had betere prestaties terwijl anderen juist weer slechtere of onveranderde resultaten lieten zien. Traditionele factoren zoals specialisatie, medische ervaring of ervaring met het gebruik van AI-tools bleken niet betrouwbaar te kunnen voorspellen op welke manier AI de prestaties zou beïnvloeden.
AI moet zeer nauwkeurig zijn
In tegenstelling tot een overall benadering die voor iedereen geschikt is, laat deze studie uitstekend zien dat de invloed van AI-assistentie op individueel niveau behoorlijk variabel is. De onderzoekers stellen dat hierdoor een meer op maat gemaakte benadering van AI nodig is. Een opvallende uitkomst van de studie is de manier waarop AI-fouten de diagnostische nauwkeurigheid kunnen beïnvloeden. Lagere AI-foutpercentages leidden over het algemeen tot aanzienlijke verbeteringen in de prestaties van radiologen. Hieruit blijkt hoe belangrijk het is dat de AI-systemen met zeer grote nauwkeurigheid worden ontwikkeld.
Succesverhalen behoeven nuance
Het onderzoek onderschat de kracht van AI niet, maar nuanceert wel duidelijk de succesverhalen die zowel in media als diverse onderzoeken over elkaar heen buitelen. Duidelijk wordt dat de integratie van AI in de klinische praktijk meer is dan het vervangen of aanvullen van menselijke expertise. Implementatie van kunstmatige intelligentie in de radiologie vraagt daarom om een beter begrip van de dynamische wisselwerking tussen menselijke en kunstmatige cognitie. Een one size fits all benadering voldoet dus niet; het is essentieel dat de beperkingen van huidige AI-modellen én de variabiliteit in menselijke respons worden meegenomen.
AI-aanbevelingen
Toekomstig onderzoek moet zich volgens deze studie vooral richten op het ontwikkelen van modellen die nauwkeuriger zijn en voorspellingen geven die de menselijke besluitvormingsprocessen aanvullen. Het wordt dan ook tijd om de hype omtrent AI te temperen. Hiernaast benadrukt de studie de noodzaak voor individuele training en het goed inwerken van clinici bij het gebruik van AI-hulpmiddelen. Tot slot pleiten de onderzoekers voor een samenwerkend zorgmodel. Het gaat om een model dat de expertise en intuïtie van de mens respecteert, maar ook de kracht van AI volop benut.