Er is momenteel in de pers veel te doen over kunstmatig intelligente programma’s die op basis van tekstinvoer en vraagstelling complete verhalen, beelden en ook geluid produceren. Werkstukken op school, boeken, foto’s, video, spraaksynthese en muziek of soundtrack, AI en deep learning lijken hierin ongekende mogelijkheden te bieden, zo schreef ik vorige week al.
Dan rijst de vraag of zoiets ook niet geschikt is voor het stellen van diagnoses, het inzetten van een behandeling of zelfs het ontwerpen van nieuwe therapieën? Laten een aantal van deze AI-programma’s tegen het licht houden in een tweetal blogs. In deze tweede blog kijk ik onder meer naar AI-tools om audio te creëren, voor medische illustraties en als virtuele assistent.
Geluid
Van tekst naar audio bestaat in tal van vormen. Daar is momentele een hele software-hausse aan de gang. De eenvoudigste vorm is die van tekst naar beeldprompts. Ondertiteling en commentaren bijvoorbeeld. Een flinke stap verder gaat het in elkaar draaien van podcasts en verslaglegging of interviews. En dan heb je ook nog de sprekende virtuele assistent, avatars, robots en hologrammen
In de popmuziek gaat het om via AI-prompts omzetten van woord in songteksten. AI bestormt de hitparade. Het genereren van een complete soundtrack en muziekcomposities behoort eveneens tot de mogelijkheden. Bekende voorbeelden zijn Mubert enTypcast.
Spraaksynthese vanuit tekst kan mensen met gestoorde hersenfuncties behoorlijk goed ondersteunen.
Samenvatten en presenteren
Het doorvorsen van grote hoeveelheden medische artikelen en verslagen gaat AI-software zoals GPT3 goed af. Het programma maakt daar snel en comfortabel relevante samenvattingen of (behandel-)richtlijnen van. Zo kan je nog eens de literatuur bijhouden. Of deze AI-software een OMT kan vervangen blijft echter nog de vraag. Ondersteunen gaat wel lukken. Microsoft werkt samen met OpenAI bij de doorontwikkeling van GPT voor medische doeleinden. Bij biomedicijnen is inmiddels al een vorm van PubMed GPT ingezet.
Een stap hoger is het stellen van een diagnose en vervolgens een behandelplan op maat opstellen. Op grond van de ingevoerde klachten en symptomen plus labbevindingen kan GPT3 daar chocola van maken in de vorm van een bijpassende diagnose. En ook een daarop afgestemde behandeling als deze in de database zit.
Let wel: Het is en blijft een intelligente techniek van Large Language Models dat op basis van ingevoerde feiten en kennis opereert. Er zit geen onderbuikgevoel en optische signalering van specifieke (uiterlijke) kenmerken van patiënt bij. Door het aankoppelen van een AI-camera zou dat laatste wel mogelijk zijn. De Lancet waarschuwde in deze al voor verkeerd vormgegeven GGZ-diagnoses.
Van een andere orde is de tekstuele uitleg aan de client door de behandelaar. GPT kan daar klip en klare informatieve voorlichting in tal van talen uit maken. Hetzelfde voor de uitwerking van colleges en lesstof voor studenten in de gezondheidszorg.
Niet alleen voorgebakken AI-antwoord
GPT3, CoPilot en Midjourney zijn niet alleen een aangelegenheid van vragen stellen en een vanuit de AI-database voorgebakken antwoord geven. In principe is de software geschikt om op basis van deep learning door te denken en ook eens met een andere invalshoek te kijken.
Van uit deze optiek kunnen de algoritmen nieuwe ziekten opsporen (afleiden uit oude, bekende of kenmerkende symptomen). Tevens een diagnose op maat door het er bij betrekken van specifieke kenmerken van de patiënt.
Weet de software welke behandeltechnieken en farmaca goed presteren bij een aandoening dan werkt dat het doorredeneren het ontwikkelen van nieuwe medische behandelingen en technologie in de hand. Kan Copilot computerregels aanvullen of er bij bedenken. Waarom dan ook niet bij medicatie en behandeling. Interessant voor DNA, immunotherapie, oncologie en stofwisselings- of neurale ziekten. En welk akelig virus kunnen we straks verwachten? Of de humane vogelgriep al voor het uitbreken om zeep helpen.
Medische illustraties en beeldmateriaal
Bij het grafisch ontwerpen van medische illustraties kunnen Midjourney, Dall-E2 en Diffusionweb zeker helpen. Dit zowel bij het tekenen van anatomie en ziektebeelden als het genereren van voorbereidende operatiebeelden en te verwachten behandelresultaten (plastische chirurgie).
Voor de database radiologie ontstaan er Photoshop-achtige mogelijkheden voor het aanvullen, te voor schijn halen of zelfs weglaten. Een uitbreiding op de al langer toegepaste AI-patroonherkenning in dit vakgebied.
Het schetsen van diagnostische beelden blijft nog lastig. Doch daar zal ook wel een kentering in komen.
GAN: strijd tussen neurale netwerken
Een mooie discriminatieve AI-techniek van Midjourney is Generative Adversarial Network (GAN. Bij deze competatieve AI-vorm bestrijden twee deep learning neurale netwerken elkaar. Het ene netwerk komt met de argumenten voor. Het ander met de tegenargumenten. Op deze wijze verscherpt GAN het uiteindelijk beeld en toepassing van de uitkomst.
Deze methode helpt zowel bij het vooraf uittesten van interventies als het monitoren van de resultaten in de loop van de tijd.
AI-assistent en de good docter
Combinaties van tekst naar spraak en beeld kunnen interessante AI-hulpen voor de mens en medische praktijk opleveren. Een virtuele assistent die een stuk verder gaat dan bijvoorbeeld in het smart home of car al het geval is. De thuisbegeleider / mantelzorg, thuiszorg, GGZ-coach en fysiotherapeut of een consult bij een arts bijvoorbeeld. De cliënt typt in en de AI zorgt voor de best passende conversatie en uitvoer van de opdrachtvragen.
Ontwerp in beeld de perfecte huisarts of specialist. De good doctor uit Midjourney. En dan komt ook het Emergeny Medical Hologram (EMH) weer in het vizier. Bij de SF-serie Startrek Voyager had je al een tamelijk arrogante EMH als scheepsdokter. Je gaf de status van het medische noodgeval (of consult) aan en er volgde een diagnose, tekst en uitleg plus best passende behandeling.
Het invoeren van AI-prompt teksten kan een enorme omwenteling betekenen voor diagnose, (gepersonaliseerde) behandeling, therapie en nieuwe medische ontdekkingen. Van samenvatten, beeld genereren en virtuele assistenten tot vooruitzien en nieuwe wegen inslaan.
Er is en blijft voorlopig echter een aantal beperkingen: Hoe betrouwbaar en recent is de data-invoer? Zitten alle benodigde data er wel in? Het is geen Internet maar een database? Zitten er mogelijk vooroordelen of gemanipuleerde zienswijzen in? Voorzichtigheid blijft geboden.
Lees hier deel 1 van de blog.
N.B: deze blog is niet geschreven met behulp van ChatGPT.