We zien dat je waarschijnlijk onze advertenties blokkeert. RTLZ.nl heeft de inkomsten uit advertenties nodig om goede, onafhankelijke verhalen te blijven maken. Ook kan het zijn dat door het gebruik van een adblocker bepaalde functies op de website niet goed werken. Maak je een uitzondering voor onze pagina's? Voor meer informatie, klik hier.
Tech

Je bent wat je tweet: zo kinderachtig ben jij (niet) op Twitter

Frederieke Hegger • 07 november 2016 22:54 @frederiekeh

Je bent wat je tweet: zo kinderachtig ben jij (niet) op Twitter
Beeld © Getty

Hoe agressief ben jij op Twitter? Onderzoekers van de Radboud Universiteit Nijmegen lieten een computer leren van honderdduizenden tweets en bouwden een tooltje die een poging waagt jouw twitterpersoonlijkheid te omschrijven. Met nadruk op: een poging. Want de computer is nog niet uitgeleerd.

Kunnen we een systeem maken dat sarcastische of agressieve tweets herkent? Dat was de hoofdvraag van de twee wetenschappers Florian Kunneman en Wessel Stoop

Het antwoord: ja, maar perfect is het systeem nog lang niet. De onderzoekers liet een computer 400.000 sarcastische en niet-sarcastische tweets analyseren om zo te ‘leren’ over het onderscheid tussen deze twee. In de sarcastische tweets stond bijvoorbeeld de hashtag #sarcasme of #not.

Agressieve tweets

Daarnaast lieten ze computer 7000 tweets, waarvan 1500 agressief analyseren; om ook dat onderscheid in het systeem te krijgen. Tot slot kregen ze een dataset van de Universiteit van Twente met tweets van verschillende leeftijdsgroepen en van mannen en vrouwen.

Al die tweets zouden een systeem moeten opleveren dat feilloos kan vaststellen wat voor type twitteraar je bent: een jong volwassen sarcastische vrouw met weinig agressie of misschien wel een puberende jongeman die alleen maar scheldwoorden de ether in slingert.

Proef op de som

Maar helaas. Dat dit machine learning experiment nog een weg te gaan heeft laat de volgende uitslag zien. Test het hier maar even zelf; dat deed ik ook.

Ik ben economieverslaggever én vrouw. Maar blijkbaar is de dataset over tweets van mannen en vrouwen zo cliché, dat iemand die twittert over economie of Tesla-auto’s wel een man moet zijn.

Machine zegt: ik ben een vent

De uitslag: mijn tweets zijn voor 57 procent mannelijk. Onderzoeker Florian Kunneman geeft lachend toe: "Het is wel een hele sekstische computer geworden op deze manier. Hij analyseert nu: zakelijke tweets zijn mannelijk, die met affectie zijn vrouwelijk. Wijzelf kijken daar natuurlijk anders tegenaan."

Wat ook niet helemaal klopt: ik mag mezelf toch net geen jong-volwassene meer noemen (score: 38 procent), en zeker geen tiener (schrikbarende score: 33 procent) en wel volwassene (28 procent). Of dat een terechte analyse is van mijn twitterpersoonlijkheid...ik hoop het niet.

Ik ben ook agressief (wut)

Volgens dit tooltje ben ik ook behoorlijk agressief: 46 procent. Als ik de tweets zo bekijk, zou ik het eerder ‘krititische tweets’ noemen. Want er zit geen scheldwoord tussen.

Wel opvallend: het ontdekken van sarcasme – toch niet gemakkelijk zou je denken - gaat bijzonder goed.

Ook positieve tweets

Onderzoeker Kunneman ziet wel dat er nog net te veel positieve tweets tussenzitten, die soms kunnen duiden op sarcasme, maar soms ook niet.

Dit onderzoek is dan ook vooral een les om in de toekomst een nog slimmere machine te maken. Nu moet de computer bijvoorbeeld kiezen: wel of niet agressief, terwijl het bij sommige tweets gewoon niet duidelijk genoeg is.

In de praktijk

Uiteindelijk zou een goede analyse van tweets waardevolle informatie kunnen opleveren voor politie (in het geval van agressieve tweets) of zelfs de Albert Heijn (hoe wordt mijn product ontvangen?), denken de onderzoekers.

Bovendien kunnen (collega-)wetenschappers zo heel makkelijk mensen ‘analyseren’.  Geen gedoe meer met het vinden van deelnemers, deze informatie is zo voorhanden. “Het is het walhalla voor onderzoekers. Mensen hoeven formeel geen toestemming te geven, kunnen onderzoek doen en delen geen persoonlijke informatie met de wereld.”

Gerelateerde artikelen