Depressie detecteren met een algoritme op Twitter

di 12 april 2022 - 09:25

Nieuws

Onderzoekers van twee Britse universiteiten hebben een algoritme ontwikkeld dat in staat is mensen met een depressie te detecteren aan de hand van hun activiteit op Twitter. Daarbij wordt gebruik gemaak van 38 verschillende signalen, zoals de gebruikte tekst in een tweet, het moment van posten en emoji gebruik. De eerste tests hebben aangetoond dat het algoritme depressie met een nauwkeurigheid van bijna 90 procent kan detecteren.

Social media kanalen zijn al lang niet meer weg te denken uit ons dagelijkse leven. Voor veel mensen is het niet alleen een vorm van entertainment, om anderen te laten meegenieten van hun dagelijkse beslommeringen, maar vooral ook een uitlaatklep voor hun gemoedstoestand. Het is precies dat laatste waardoor onderzoekers van de universiteiten van Brunel in Londen en Leicester op het idee kwamen die informatie te gebruiken voor andere doeleinden, zoals het detecteren van personen die (mogelijk) aan een depressie lijden.

"We hebben het algoritme getest op twee grote databases en onze resultaten vergeleken met andere depressie detectie-technieken. In alle gevallen zijn we erin geslaagd om de bestaande technieken te overtreffen in termen van hun classificatienauwkeurigheid", vertelt professor Abdul Sadka, directeur van Brunel's Institute of Digital Futures.

Algoritme voor depressie detectie

Zij ontwikkelden een algoritme dat in staat is de mentale toestand van een persoon te analyseren door 38 datapunten te extraheren en te analyseren uit hun openbare Twitter-profiel. Datapunten zoals de inhoud van hun berichten, hun posttijden en de andere gebruikers in hun sociale netwerk.

Tijdens de ontwikkeling hebben de onderzoekers, voor het trainen van het algoritme, gebruik gemaakt van twee databases met daarin de Twitter-geschiedenis - gepostte berichten - van duizenden gebruikers. Daarnaast konden zij ook gebruik maken van aanvullende informatie over de geestelijke gezondheid van die gebruikers.

Van al die data werd 80 procent gebruikt voor het trainen van het algoritme. De overige 20 procent van de data werd vervolgens ingezet om de nauwkeurigheid van het algoritme te testen. Vervolgens is de nauwkeurigheid van het algoritme bepaald. Voor de twee databases, de Tsinghua Twitter Depression Dataset en de CLPsych 2015-dataset van John Hopkins University, kwam de nauwkeurigheid van het algoritme uit op respectievelijk 88,39 procent en 70,69 procent.

Preventieve werking

Volgens de onderzoekers is het door hen ontwikkelde algoritme in staat de depressie van een gebruiker te signaleren voordat deze iets in het publieke domein plaatst. Daarmee wordt volgens de onderzoekers de weg vrijgemaakt voor platforms zoals Twitter en Facebook om proactief geestelijke gezondheidsproblemen bij gebruikers te signaleren.

“In machine learning wordt een nauwkeurigheid van boven de 90 procen als uitstekend beschouwd. Dus 88 procent voor een van de twee databases is fantastisch. Het is niet 100 procent nauwkeurig, maar ik denk niet dat op dit niveau een machine learning-oplossing 100 procent betrouwbaarheid kan bereiken. Maar hoe dichter je bij het cijfer van 90 procent komt, hoe beter", aldus professor Abdul Sadka.

Het gebruik van de online activiteit die mensen ontplooien als een bron van informatie voor diagnostische doeleinden is niet nieuw. Zo'n vijf jaar geleden experimenteerde Google al met het opsporen van mensen die mogelijk depressieve klachten hebben aan de hand van hun zoekgedrag op het internet.