What does the bird say? De link tussen persoonlijkheid en taalgebruik in Nederlandstalige tweets.

Sofie
Vandenhoven

Wat doe jij om niet alle informatie van jezelf vrij te geven op het Internet? Let je erop om in je Tweets geen namen te noemen van je kinderen of je schoonouders? Link je nergens van je ene sociale mediaprofiel naar het andere? Of laat je echt alles blanco en bestaat je profiel enkel uit jouw Tweets? Op een of andere manier bescherm je je anonimiteit en komt niemand iets van je te weten, toch? Of toch niet helemaal?

Dog goes woof, cat goes miaw. Bird goes tweet and mouse goes squeek.

Het is de 21e eeuw: ondertussen beseft iedereen al dat er geen ruimte is voor ‘anonimiteit’ en ‘privacy’ op het internet: de seconde nadat je online geshopt hebt, plaatsen Facebook en Twitter nog een tiental gelijkaardige producten op je feed in de vorm van reclame. Ook Cookies zorgen ervoor dat je webervaring nog persoonlijker en beter wordt. De algoritmes kennen je interesses, maar tegenwoordig maak je je daar al niet meer druk om. Maar wat als je Twitterprofiel ook echt persoonlijke informatie over jou vrijgeeft? Meer bepaald over hoe je zelf in elkaar zit, qua persoonlijkheid? Maak je je daar al iets drukker om?

Want die informatie, die is er en die verspreid je zelf, waarschijnlijk onbewust. Want misschien weet je wel dat je aantal followers of following op Twitter iets zeggen over je, je kon misschien niet echt vermoeden dat ook het meest anonieme Twitteraccount - zonder foto’s, followers of following, zonder bio, links of enige andere informatie - iets weggeeft over de persoon achter het profiel. Op voorwaarde dat er statusupdates zijn natuurlijk, want er is slechts één element nodig om die info te weten te komen: taal.

Cow goes moo, frog goes croak and the elephant goes toot.

Tot op heden zijn er nog twee verschillende elementen nodig om informatie over je persoonlijkheid te weten te komen: eerst en vooral de Tweets zelf, maar ook een correct persoonlijkheidsprofiel. In onderzoek wordt dit gemeten aan de hand van The Big Five of Personality, een algemeen aanvaard meetinstrument voor persoonlijkheid. Eenmaal er een persoonlijkheidsprofiel is, kunnen bepaalde talige elementen die vaak voorkomen misschien gelinkt worden aan een bepaalde eigenschap van The Big Five, zijnde Openheid ten op zichte van nieuwe ervaringen (Openness), Zorgvuldigheid (Conscientiousness), Extraversie (Extraversion), Service gerichtheid: anderen helpen (Agreeableness) en Emotionele stabiliteit (Neuroticism).  Het begrip ‘talig element’ kan ook nog opgesplitst worden: zijn het de woordsoorten (substantieven, adjectieven, werkwoorden…) of juist de woordcategorieën (woorden over het thema familie, de dood, tijd…) die informatie over persoonlijkheid vrijgeven?

Ducks say quack and fish go blub and the seal goes ow ow ow ow ow

Uit onderzoek bleek dat woordsoorten meer vrijgeven over het geslacht van de gebruiker dan over persoonlijkheid, maar vooral ook dat de thema’s waarover iemand praat, en dus bepaalde woorden, een sterke relatie hebben met bepaalde karaktereigenschappen. Zo blijkt dus dat mensen die vaker verwijzen naar familie en vrienden hoger scoren op de karaktereigenschap Openheid. Maar daar houdt het niet op: doordat ons onderzoek uitwees dat die informatie inderdaad uit taal afgeleid kan worden, opent dit heel wat perspectieven.

But theres one sound that no one knows: What does the fox say?

Want als de eigenschappen van The Big Five of Personality (deels) afgeleid kunnen worden uit taalgebruik, dan is de volgende logische stap computertraining om persoonlijkheid te voorspellen aan de hand van Tweets. Op deze manier kunnen bijvoorbeeld de reclames aangepast worden aan extraverte of introverte kopers, suggesties om nieuwe mensen te followen kunnen gebaseerd worden op jouw persoonlijkheid, of je kan zelfs zoeken op mensen die “introvert” en “open” zijn.

Daarnaast kan ook getest worden of de meer negatieve karaktereigenschappen, zoals narcisme of psychoticisme gelinkt kunnen worden aan taal. Indien dit mogelijk zou zijn, is de volgende logische stap hetzelfde als bij the Big Five: persoonlijkheidsvoorspelling. En heeft ook heel wat voordelen in petto. Cyberpesten zou bijvoorbeeld vlugger opgespoord kunnen worden of misschien zelfs voorkomen worden: er zou een profiel gemaakt kunnen worden van gekende cyberpesters en gepeste mensen. Dit profiel kan dan gebruikt worden bij het opsporen van potentiële pesters en gepesten. Ook zou het op deze manier gemakkelijker kunnen zijn om pedofielen die zich als minderjarigen voordoen te ontmaskeren.



Een ding is alvast zeker: we might not know what the fox says, we sure do know what the bird says.

Download scriptie (2.15 MB)
Universiteit of Hogeschool
Universiteit Gent
Thesis jaar
2016
Promotor(en)
Dr. Orphée De Clercq