Een AI-Chatbot voor de zorg is nog toekomstmuziek

Vrijwel iedereen die op een website van een dienstverlener naar informatie zoekt is er wel eens mee in aanraking gekomen: de chatbot. Ze worden steeds beter en intelligenter. Sinds een paar maanden is ChatGPT, een AI-chatbot die niet alleen antwoorden geeft, maar ook geautomatiseerd gedetailleerde informatie biedt, een hype. Google en DeepMind werken nu aan een AI-chatbot, Med-PaLM, voor de zorg.

In het kielzog van het nieuws en succes van ChatGPT zagen wetenschappers ook mogelijkheden voor een toepassing van een AI-Chatbot in de zorg. Inmiddels wordt al volop gewerkt aan de ontwikkeling van Med-PaLM voor de zorg, al duurt het wel nog een tijd voordat die ook daadwerkelijk ingezet kan worden ter vervanging van de chatbots of digitale assistenten zoals die nu nog volop gebruikt worden.

AI-chatbots kunnen vragen die gesteld worden begrijpen en geven automatisch gegenereerde antwoorden in gewone taal. De zogenoemde Large Language Modellen (LLM's) hebben al indrukwekkende resultaten laten zien als het gaat om het begrijpen en genereren van natuurlijke taal.

Succes ChatGPT vertalen naar de zorg

ChatGPT is een showcase-technologie voor consumenten. Echter, de kwaliteitsstandaard voor medische en klinische toepassingen ligt eens stuk hoger dan bij toepassingen voor consumenten. Med-PaLM is daarom ontworpen om binnen engere parameters te werken. De medische AI-chatbot is getraind op zeven datasets voor het beantwoorden van zorggerelateerde vragen van zowel zorgprofessionals als patiënten.

In een artikel over de ontwikkeling en mogelijkheden van een AI-Chatbot voor de zorg suggereren onderzoekers dat Med-PaLM doorontwikkeld kan worden zodat hij ook geschikt wordt voor klinische toepassingen. Daarvoor zijn inmiddels al een zestal datasets toegankelijk gemaakt: NedQA, MedMCQA, PubMedQA, LiveQA, MedicationQA en MMLU.

Eigen datasets voor Med-PaLM

De ontwikkelaars van Google en DeepMind hebben intussen al hun eigen datasets ontwikkeld, HealthSearchQA genaamd. Die sets zijn samengesteld op basis van online geplaatste vragen over medische aandoeningen en de bijbehorende symptomen.

De onderzoekers achter het project wijzen op een aantal mogelijke toepassingen, waaronder het ophalen van kennis en ondersteuning van klinische beslissingen. Maar ook het samenvatten van de belangrijkste bevindingen in onderzoeken en het triageren van patiënten in de eerstelijnszorg behoort tot de mogelijkheden.

Toekomstmuziek

Dat is wel nog toekomstmuziek, want alhoewel Med-PaLM al bemoedigende resultaten laat zien, blijven de antwoorden en beoordelingen nog ver achter bij die van menselijk artsen en onderzoekers. Uit onderzoek blijkt namelijk dat Med-PaLM op dit moment in bijna 17 procent van de bevragingen niet de juiste informatie voor het genereren van antwoorden en tekst ophaalt. Bij artsen lag dat percentage op minder dan 4 procent.

Vergelijkbare verschillen tussen de AI-Chatbot en menselijke artsen werden ook bij het trekken van onjuiste medische conclusies (10 procent bij Med-PaLM versus 2 procent bij menselijke artsen). Ook gaf Med-PaLM veel vaker, in bijna 19 procent van de gevallen, foutieve informatie dan de menselijke artsen (slechts 1,4 procent).

"Ons onderzoek laat al wel iets zien over de kansen en uitdagingen voor het toepassen van deze technologieën op de geneeskunde in het verschiet liggen. "We hopen dan ook dat dit onderzoek leidt tot verdere gesprekken en samenwerkingen tussen patiënten, consumenten, AI-onderzoekers, clinici, sociale wetenschappers, ethici, beleidsmakers en andere geïnteresseerden. Met als doel deze vroege onderzoeksresultaten op een verantwoorde manier te vertalen om de gezondheidszorg te verbeteren", zo schrijven de onderzoekers.