Er is momenteel in de pers veel te doen over kunstmatig intelligente programma’s die op basis van tekstinvoer en vraagstelling complete verhalen, beelden en ook geluid produceren. Werkstukken op school, boeken, foto’s, video, spraaksynthese en muziek of soundtrack, AI en deep learning lijken hierin ongekende mogelijkheden te bieden.
Dan rijst de vraag of dergelijke AI-toepassingen ook niet geschikt zijn voor de zorg. Voor het stellen van diagnoses, het inzetten van een behandeling of zelfs het ontwerpen van nieuwe therapieën. Laten wij echter eerst een aantal van deze AI-programma’s tegen het licht houden in een tweetal blogs. In deel 1 kijken we onder meer naar AI-tools als copywriter, om computercode te schrijven en beelden te maken.
GPT-3 als copywriter
Een uitkomst voor de leerling of student die even geen tijd heeft (of te lui is) voor het zelf schrijven van een werkstuk, samenvatting of scriptie, het programma GPT-3 van OpenAI doet dat wel even voor jou.
De naam GPT-3 staat voor Generative Pre-trained Transformer (version 3). In de praktijk gaat het om een slim en vindingrijk stukje AI-software dat erg goed is in het schrijven van teksten uit databasebronnen. GPT-3 kan essays schrijven, lange teksten analyseren, teksten inkorten (samenvatting maken) en versimpelen ‘literatuur’ en filmscripts uit de AI-mouw schudden en vragen beantwoorden. Ment noemt dat Large Language Models (LLM). Er is een aparte variant die ook computercode kan schrijven, onder meer Copilot.
Alan Turing had het in de jaren 50 van de vorige eeuw al min of meer voorspeld: AI gaat de mensheid evenaren, zelfs bij het generen van tekst. Verder moet je natuurlijk niet vergeten dat AI en deep learning zelf ook met taal werken. Een uitstapje naar literaire prestaties ligt dan voor de hand.
Momenteel draait de hype in deze om de publieksversie ChatGPT. Daar kan iedereen mee aan de slag met wisselend een goed of toch wat dubieus resultaat.
Voorspellen en na-apen
De kern van GPT-3 en AI-consorten zit in het voorspellen van tekst afgeleid uit eerder via deep learning eigengemaakte bronnen. Het programma weet als het ware waar het met de taal naar toe moet als je vragen en opdrachten invoert.
Ook spreekt men wel van slim na-apen. In de eigen database staan de zinsbouw voor tal van soorten tekst, wat mensen prettig vinden om te lezen en hoe je woorden logisch aan elkaar knoopt. Daar gaat uiteraard een lange tijd van training en deep learning aan vooraf. Daarbij heeft GPT-3 geleerd wat het voorspelbare antwoord op de gestelde vragen is. En het grootste artificiële neurale netwerk dat tot op heden geconstrueerd is, weet daar prima raad mee.
Toch is het allemaal niet foolproof (Is het wel echt of waar?) hoewel dat behoorlijk moeilijk te detecteren valt. Sommige ingevoerde bronnen blijken minder betrouwbaar of zijn niet goed geïnterpreteerd. En ook een meervoudige duiding van tekst kan de boel (deels) doen misukken.
Er zijn inmiddels al speciale detectieprogramma’s beschikbaar die het gebruik van GPT-3 kunnen aantonen. Overigens is het niet allemaal fraude of luiheid dat bij GPT-3 te klok slaat. Het programma is een goede assistent en leermeester bij het leren van teksten te vervaardigen.
Computertaal
Wat met tekst kan, lukt ook met computertaal. Hier gooit het AI-programma Copilot van GitHub (Microsoft) hoge ogen. Voer natuurlijke taal als prompts in en Copilot zet deze om in coderingsopdrachten voor meerdere computertalen. Dat scheelt programmeurs een hoop tijd en er komen regelmatig nieuwe slimme oplossingen uit!
Volgens de maker GitHub voert Copilot drie belangrijke taken uit.
- Bespaart veel onnodige tijd op het schijven van routines in de gebruikte programmeertalen.
- Het geven van suggesties om nog betere codes te schrijven. Ook het er uit halen van bugs.
- Het makkelijker onder de knie krijgen van complexe CODECs.
Copilot integreert direct in editors zoals Visual Studio, Neovim, Jet Brains en VS Code. Een spraakgestuurde versie is in ontwikkeling.
Van tekst naar beeld
Wat met tekst kan, gaat AI ook in beeld goed af. Het creëren van foto’s, tekeningen, grafische beelden, illustraties en zelfs decors gaat programma’s zoals Midjourney, Diffusionweb en Dall-E2 verrassend goed af. En video staat al in de steigers.
Maar worden deze AI-pakketten dan straks de toekomst van de beeldverwerking? In ieder geval maken alle drie de genoemde AI-pakketten op basis van een ingevoerde korte beschrijvende tekst indrukwekkende afbeeldingen. In iedereen schuilt dan wel een kunstenaar mits je maar een goed uitgangsidee hebt.
Concreet verschuift de expertise van een designer steeds verder van ontwerpen naar bedenken. Handmatig Photoshoppen op basis van fotografie en stockfoto’s transformeert naar geautomatiseerde beeldbewerking. Ook het fotograferen op maat is regelmatig niet meer nodig. Je trekt het gewoon uit de database en past het met AI-prompts aan. Idem bij video. Met AI kent de creativiteit geen grenzen en gaat ver buiten het realisme en brengt de fantasie pas echt tot leven. En dat is beslist geen gek idee. Dromen worden waarheid, tijd en materiaal wordt bespaard en weinig staat de fantasie meer in de weg.
Een andere toepassing betreft het snel kunnen maken van line-outs / schetsen en proefontwerpen.
Volgende week verschijnt deel 2 van deze blog, met daarin onder meer aandacht voor de rol van intelligente programma’s.
N.B: deze blog is niet geschreven met behulp van ChatGPT.