What does the bird say: a corpus study on how Twitter language use reflects personality

Sofie Vandenhoven
Persbericht

What does the bird say? De link tussen persoonlijkheid en taalgebruik in Nederlandstalige tweets.

Wat doe jij om niet alle informatie van jezelf vrij te geven op het Internet? Let je erop om in je Tweets geen namen te noemen van je kinderen of je schoonouders? Link je nergens van je ene sociale mediaprofiel naar het andere? Of laat je echt alles blanco en bestaat je profiel enkel uit jouw Tweets? Op een of andere manier bescherm je je anonimiteit en komt niemand iets van je te weten, toch? Of toch niet helemaal?

Dog goes woof, cat goes miaw. Bird goes tweet and mouse goes squeek.

Het is de 21e eeuw: ondertussen beseft iedereen al dat er geen ruimte is voor ‘anonimiteit’ en ‘privacy’ op het internet: de seconde nadat je online geshopt hebt, plaatsen Facebook en Twitter nog een tiental gelijkaardige producten op je feed in de vorm van reclame. Ook Cookies zorgen ervoor dat je webervaring nog persoonlijker en beter wordt. De algoritmes kennen je interesses, maar tegenwoordig maak je je daar al niet meer druk om. Maar wat als je Twitterprofiel ook echt persoonlijke informatie over jou vrijgeeft? Meer bepaald over hoe je zelf in elkaar zit, qua persoonlijkheid? Maak je je daar al iets drukker om?

Want die informatie, die is er en die verspreid je zelf, waarschijnlijk onbewust. Want misschien weet je wel dat je aantal followers of following op Twitter iets zeggen over je, je kon misschien niet echt vermoeden dat ook het meest anonieme Twitteraccount - zonder foto’s, followers of following, zonder bio, links of enige andere informatie - iets weggeeft over de persoon achter het profiel. Op voorwaarde dat er statusupdates zijn natuurlijk, want er is slechts één element nodig om die info te weten te komen: taal.

Cow goes moo, frog goes croak and the elephant goes toot.

Tot op heden zijn er nog twee verschillende elementen nodig om informatie over je persoonlijkheid te weten te komen: eerst en vooral de Tweets zelf, maar ook een correct persoonlijkheidsprofiel. In onderzoek wordt dit gemeten aan de hand van The Big Five of Personality, een algemeen aanvaard meetinstrument voor persoonlijkheid. Eenmaal er een persoonlijkheidsprofiel is, kunnen bepaalde talige elementen die vaak voorkomen misschien gelinkt worden aan een bepaalde eigenschap van The Big Five, zijnde Openheid ten op zichte van nieuwe ervaringen (Openness), Zorgvuldigheid (Conscientiousness), Extraversie (Extraversion), Service gerichtheid: anderen helpen (Agreeableness) en Emotionele stabiliteit (Neuroticism).  Het begrip ‘talig element’ kan ook nog opgesplitst worden: zijn het de woordsoorten (substantieven, adjectieven, werkwoorden…) of juist de woordcategorieën (woorden over het thema familie, de dood, tijd…) die informatie over persoonlijkheid vrijgeven?

Ducks say quack and fish go blub and the seal goes ow ow ow ow ow

Uit onderzoek bleek dat woordsoorten meer vrijgeven over het geslacht van de gebruiker dan over persoonlijkheid, maar vooral ook dat de thema’s waarover iemand praat, en dus bepaalde woorden, een sterke relatie hebben met bepaalde karaktereigenschappen. Zo blijkt dus dat mensen die vaker verwijzen naar familie en vrienden hoger scoren op de karaktereigenschap Openheid. Maar daar houdt het niet op: doordat ons onderzoek uitwees dat die informatie inderdaad uit taal afgeleid kan worden, opent dit heel wat perspectieven.

But theres one sound that no one knows: What does the fox say?

Want als de eigenschappen van The Big Five of Personality (deels) afgeleid kunnen worden uit taalgebruik, dan is de volgende logische stap computertraining om persoonlijkheid te voorspellen aan de hand van Tweets. Op deze manier kunnen bijvoorbeeld de reclames aangepast worden aan extraverte of introverte kopers, suggesties om nieuwe mensen te followen kunnen gebaseerd worden op jouw persoonlijkheid, of je kan zelfs zoeken op mensen die “introvert” en “open” zijn.

Daarnaast kan ook getest worden of de meer negatieve karaktereigenschappen, zoals narcisme of psychoticisme gelinkt kunnen worden aan taal. Indien dit mogelijk zou zijn, is de volgende logische stap hetzelfde als bij the Big Five: persoonlijkheidsvoorspelling. En heeft ook heel wat voordelen in petto. Cyberpesten zou bijvoorbeeld vlugger opgespoord kunnen worden of misschien zelfs voorkomen worden: er zou een profiel gemaakt kunnen worden van gekende cyberpesters en gepeste mensen. Dit profiel kan dan gebruikt worden bij het opsporen van potentiële pesters en gepesten. Ook zou het op deze manier gemakkelijker kunnen zijn om pedofielen die zich als minderjarigen voordoen te ontmaskeren.

Een ding is alvast zeker: we might not know what the fox says, we sure do know what the bird says.

Bibliografie

Allport, G.W. & Odbert, H.S. (1936). Trait-names, a psycho-lexical study. Psychological review publications, 47(1), i-171. doi:10.1037/h0093360 Back, M.D., Stopfer, J.M., Vazire, S., Gaddis, S., Schmuckle, S.C., Egloff, B. et al. (2010). Facebook Profiles Reflect Actul Personality, Not Self-Idealization. Psychological Science, 21(3), 372-374. doi:10.1177/0956797609360756  Barker, V. (2009). Older Adolescents’ Motivations for Social Network Site Use: The Influence of Gender, Group Identity, and Collective Self-Esteem. Cyberpsychology & Behaviour, 12(2), 209-213. Doi:10.1089/cpb.2008.0228 Beck, J. (1999). Jesus & Personality Theory: Exploring the Five-Factor Model. Illinois: InterVarsity Press Budaev, S.V. (1999). Sex differences in the Big Five personality factors: testing an evolutionary hypothesis. Personality and Individual differences, volume 26, 801-813. Cattell, R.B. (1946). Personality structure and measurement of personality. Oxford, England: World Book Company. Correa, T., Hinsley, A. & Gil de Zúñiga, H. (2010). Who interacts on the Web?: The intersection of users’ personality and social media use. Computers in Human Behavior, 26(2), 247-253. Doi:10.1016/j.chb.2009.09.003 De Smedt, T. & Daelemans, W. (2012). Vreselijk mooi! Terribly beautiful: a subjectivity lexicon for Dutch adjectives. Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC-2012), 3568–3572. Demeester, S. (2014). Twitter opent kantoor in Brussel. De Tijd. Retrieved from http://www.tijd.be/ondernemen/media_marketing/Twitter_opent_kantoor_in_…. 9569376-3133.art Digman, J.M. (1990). Personality Structure: Emergence of the Five-Factor Model. Annual Review of Psychology, 41, 417-440. doi: 10.1146/annurev.ps.41.020190.002221 Facebook. (2016). Company info. Retrieved on May 12th 2016 from http://newsroom.fb.com/company-info/ Galton, F. (1884). Measurement of Character. Fortnightly Review, 36. 179-185. doi: 10.1037/11352-058 Golbeck, J., Robles, C. & Turner, K. (2011a). Predicting personality with social media. CHI ’11 Extended Abstracts on Human Factors in Computing Systems, 253-262. doi:10.1145/1979742.1979614 Golbeck, J. Robles, C., Edmondson, M. & Turner, K. (2011b). Predicting personality with Twitter. Privacy, Security, 2011 IEEE Third International Conference on Privacy, Security, Risk and Trust, and IEEE International Conference on Social Computing (SocialCom). 149-156. doi:10.1109/PASSAT/SocialCom.2011.33 Goldberg, L. (1990). An alternative “description of personality”: the big-five factor structure. Journal of Personality and Social Psychology, 59(6), 1216-1229. doi:10.1037/00223514.59.6.1216  Goldberg, L. (1993). The structure of phenotypic personality traits. American Psychologist, 48(1), 26-34. doi:10.1037/0003-066X.48.1.26 Gosling, S.D. (2003). A very brief measure of the Big-Five personality domains. Journal of Research in Personality, 37(6), 504-528. doi:10.1016/S0092-6566(03)00046-1 Grooming. (s.d.). In Cambridge Dictionaries online. Retrieved from http://dictionary.cambridge.org/dictionary/english/grooming Hamburger, Y.A. & Ben-Artzi, E. (2000). The relationship between extraversion and neuroticism and the different uses of the Internet. Computers in Human Behavior, 16(4), 441-449. doi: 10.1016/S0747-5632(00)00017-0 
56 
 
Hughes, D.J., Rowe, M., Batey, M. & Lee, A. (2012). A tale of two sites, Twitter vs. Facebook and the personality predictors of social media usage. Computers in Human Behavior, 28(2), 561-569. doi:10.1016/j.chb.2011.11.001 Jijkoun, V. & Hofmann, K.: 2009, Generating a non-English subjectivity lexicon: Relations that matter. Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL-2009), 398-405. John, O.P. & Srivastava, S. (1999). The Big-Five Trait Taxonomy: History, Measurement and Theoretical Perspectives. In Pervin, L. & John, O.P. (Eds.), Handbook of personality (pp. 102-138). New York: Guilford. Judge, T.A., Higgins, C.A., Thoresen, C.J. & Barrick, B.R. (1999). The Big Five Personality Traits, General Mental Ability, And Career Success Across The Life Span. Personnel Psychology, 52(3), 621-652. doi:10.1111/j.1744-6570.1999.tb00174.x Lenhart, A., Purcell, K., Smith, A. & Zickuhr, K. (2010). Social Media & Mobile Internet Use among Teens and Young Adults. Millennials. Pew Internet & American Life Project. Lynn, R. & Martin, T. (1997). Gender differences in Extraversion, neuroticism and psychotism in 37 nations. The Journal of Social Psychology, volume 137(3), 369-373. doi: 10.1080/00224549709595447 McWorther, J. (2013) Txtng is killing language. JK!!!. TED-talk. Retrieved from https://www.youtube.com/watch?v=UmvOgW6iV2s Microblog. (s.d.). In Cambridge Dictionaries Online. Retrieved from http://dictionary.cambridge.org/dictionary/english/microblog Mischel, W. (2013). Personality and Assessment. Psychology Press. Murray, B.R. & Mount, M.K. (1991). The Big Five Personality Dimensions And Job Performance: A Meta-Analysis. Personnel Psychology, 44(1), 1-26. doi: 10.1111/j.1944-6570.1991.tb00688.x Norman, W.T. (1967). 2,800 personality trait descriptors: normative operating characteristics for a university population. S.l.: University of Michigan, Dept. of Psychology. Pennebaker, J. W., Francis M.E. & Booth R.J. (2001). Linguistic Inquiry and Word Count (LIWC): LIWC2001. Mahwah: Lawrence Erlbaum Associates. Pennebaker, J.W., Mehl, M.R. & Niederhoffer, K.G. (2003). Psychological aspects of natural language use: our words, our selves. Annual review of psychology, volume 54(1), 547577. doi: 10.1146/annurev.psych.54.101601.145041 Primi, R., Ferreira-Rodrigues, C.F. & De Francisco Carvalho, L. (2014). Cattell’s Personality Factor Questionnaire (CPFQ): Development and Preliminary Study. Paidéia, 24(57), 29-37. doi:10.1590/1982-43272457201405  Rosen, P.A. & Kluemper, D.H. (2008). The Impact of the Big Five Personality Traits on the Acceptance of Social Networking Website. AMCIS 2008 Proceedings. Paper 274. Retrieved from http://aisel.aisnet.org/cgi/viewcontent.cgi?article=1276&context=amcis2… Ross, C., Orr, E.S., Sisic, M., Arseneault J.M., Simmering, M.G. & Orr, R.R. (2009). Personality and motivations associated with Facebook use. Computers in Human Behavior, 25(2), 578-586. doi:10.1016/j.chb.2008.12.024 Schwartz, A.H., Eichstaedt, J.C., Kern, M.L., Dziurzynski, L., Ramones, S.M., Agrawal, M. et al. (2013). Personality, Gender, and Age in the Language of Social Media: The Open-Vocabulary Approach. PloS one, 8(9), e73791. Doi: 10.1371/journal.pone.0073791 Shaver, P.R. & Brennan, K.A. (1992). Attachment Styles and the “Big Five” Personality Traits: Their Connections with Each Other and with Romantic Relationship Outcomes. Personality and Social Psychology Bulletin, 18(5), 536-545. doi:10.1177/0146167292185003 
57 
 
Social media. (s.d.). In Oxford Dictionaries. Retrieved from http://www.oxforddictionaries.com/definition/english/social-media Statista. (2016). Leading social networks worldwide as of April 2016, ranked by number of active users (in millions). Retrieved on May 12th 2016 from http://www.statista.com/statistics/272014/global-social-networks-ranked… Tupes, E. C. & Christal, R. E. (1961). Recurrent personality factors based on trait ratings (USAF ASD Tech. Rep. No. 61-97). Lackland Air Force Base, TX: U.S. Air Force. Twitter. (2016). Bedrijf About. Retrieved on May 12th 2016 from https://about.twitter.com/nl/company User-generated content. (s.d.) In Oxford Dictionaries. Retrieved from http://www.oxforddictionaries.com/definition/english/user-generated?q=u… Van de Kauter, M., Coorman, G., Lefever, E., Desmet, B., Macken, L., & Hoste, V. (2013). LeTs Preprocess: The multilingual LT3 linguistic preprocessing toolkit. Computational Linguistics in the Netherlands Journal, volume 3, 103-120.  Vianello, M., Schnabel, K. Sriram, N. & Nosek, B. (2013). Gender differences in implicit and explicit personality traits. Personality and Individual differences, volume 26, 994-999. Zijlstra, H., van Meerveld, T., van Middendorp, H., Pennebaker, J.W. & Geenen, R. (2004). De Nederlandse versie van de ‘Linguistic Inquiry and Word Count’ (LIWC). Gedrag & Gezondheid, volume 32(4), 271-281. 

Universiteit of Hogeschool
Master of Arts in het tolken Nederlands, Engels en Italiaans
Publicatiejaar
2016
Promotor(en)
Dr. Orphée De Clercq
Kernwoorden
enjoytheflames
Share this on: