Gestandaardiseerde toetsen: onbenut potentieel voor gelijke onderwijskansen?

Stijn
Kerkhofs

Dit schooljaar is het zover: de Vlaamse toetsen gaan van start. Naast de algemene onderwijskwaliteit in kaart te brengen, kunnen leerkrachten deze gestandaardiseerde toetsen ook gebruiken als informatiebron tijdens deliberaties. Een gestandaardiseerde toets houdt in dat leerlingen een toets afleggen over dezelfde inhoud, in identieke omstandigheden. Dit maakt het mogelijk om scores tussen leerlingen en scholen te vergelijken

De bedoeling is dat leerkrachten op die manier objectievere informatie hebben over welke eindtermen de leerling al dan niet behaald heeft. Onderzoek toont immers aan dat leerkrachten vaak subjectieve kenmerken gebruiken zoals motivatie, welbevinden of het ‘algemene toekomstbeeld’ van de leerling. Dit is vaak in het nadeel van leerlingen met een lagere sociaaleconomische status (SES) en kan een probleem vormen voor gelijke onderwijskansen.

Ongelijke onderwijskansen

De laatste jaren gaan bij elk nieuw PISA-rapport de nodige alarmbellen af over de dalende resultaten van het Vlaamse onderwijs. Wat minder aandacht krijgt, is dat Vlaanderen ook op vlak van gelijke onderwijskansen erg zwak scoort. Zo zijn vooral kansarme leerlingen slachtoffer van het beruchte watervalsysteem. Het verschil in populatie tussen de gemiddelde ASO-school en BSO-school is frappant.

Eerder onderzoek toont aan dat het studieadvies voor leerlingen aanzienlijk wordt beïnvloed door hun SES. Leerlingen met een lagere SES krijgen, ongeacht hun schoolprestaties, minder vaak het advies om theoretische studierichtingen te volgen, vooral voor Latijn en moderne wetenschappen. Leerlingen met een hogere SES worden vaker bevoordeeld, zelfs als hun prestaties vergelijkbaar zijn met die van leerlingen met een lagere SES. Scholen met een hogere SES-leerlingenpopulatie geven doorgaans hogere adviezen, ongeacht eerdere prestaties.

Leerkrachten beoordelen ook gedrag en vaardigheden, wat leerlingen met een lagere SES kan benadelen. Dat komt omdat stereotypen over deze groep de beoordelingen kunnen beïnvloeden. Leerkracht houden ook rekening met ouders, waarbij ouders met een hogere SES meestal als meer ondersteunend worden gezien. Deze bevindingen onderstrepen de impact van SES en stereotypen op studieadviezen en werpen vragen op over gelijke kansen in het onderwijs.

Gestandaardiseerde toetsen to the rescue?

Leerling maakt een toets

Gelukkig is er ook een mogelijke oplossing: standaardisering! Het idee hierbij is dat hoe meer je doelstellingen, curriculum en evaluatie objectief maakt, hoe minder invloed het subjectieve oordeel van de leerkracht zal hebben. De eindtermen bieden in Vlaanderen al een zekere mate van standaardisering – elke school streeft min of meer dezelfde doelstellingen na - maar centrale toetsen hebben we voorlopig nog niet.

Binnenkort kunnen de Vlaamse toetsen deze rol misschien vervullen, maar voorlopig komen we met de interdiocesane proeven en de OVSG-toets het dichtst in de buurt. Dit zijn gestandaardiseerde toetsen die de onderwijskoepels zelf ontwikkelden voor het eigen net. Een gevolg hiervan is dat de inhoud van de toetsen gebaseerd is op de eigen leerplannen in plaats van de eindtermen, en dat vergelijkende analyses op macroniveau niet mogelijk zijn.

Netgebonden toetsen worden amper gebruikt op leerlingniveau

In zijn masterproefonderzoek ging Stijn Kerkhofs na op welke manier leerkrachten de data uit netgebonden toetsen gebruiken bij de beslissing over het toekennen van een getuigschrift basisonderwijs. Ook werd er gekeken wat de impact hiervan is op gelijke onderwijskansen. Het onderzoek werd uitgevoerd via een survey (ingevuld door 98 respondenten) en vijf interviews.

Uit het onderzoek kwamen naar voren dat leerkrachten zich vooral baseren op de eigen toetsen. Netgebonden toetsen worden aanvullend gebruikt om een extra, objectieve blik te hebben, maar bieden onvoldoende nieuwe informatie om echt relevant te zijn. Het al dan niet gebruiken van netgebonden toetsen heeft daarnaast geen invloed op hoe leerkrachten naar GOK-leerlingen kijken. Tenslotte bevestigt dit onderzoek dat leerkrachten hun beslissing voor een groot stuk baseren op subjectieve factoren zoals de motivatie en het welbevinden van de leerling.

Een kind waarbij dat je twijfelt over getuigschrift of niet, en die weet eigenlijk al dat die in een bouwsector terecht wil komen of in de verzorging ofzo, kan je al vlugger toch oriënteren naar een B-stroom dan naar een A-stroom.

Het beperkte gebruik van de netgebonden toetsen betekent niet dat leraren per definitie weigerachtig staan tegenover het gebruik van gestandaardiseerde toetsen. Uit het onderzoek blijkt eerder dat de netgebonden toetsen de rol van objectieve lat volgens de leraren onvoldoende kunnen vervullen. Dit is niet verwonderlijk, aangezien de netgebonden toetsen in de eerste plaats bedoeld zijn om te gebruiken voor de kwaliteitszorg op schoolniveau.

Het gevoel over weinig objectieve informatie te beschikken, maakt dat leraren meer beroep doen op hun intuïtie. Hierbij bestaat het risico dat de beslissing gekleurd wordt door impliciete stereotypen tegenover leerlingen met een lagere SES.

Uitdagingen voor de Vlaamse toetsen

Vanuit de bevindingen uit het huidige onderzoek kunnen we vooruitblikken naar de Vlaamse toetsen die vanaf dit schooljaar zullen worden afgenomen. Meer dan dat bij de netgebonden toetsen het geval was, kunnen deze toetsen meegenomen worden in de beoordeling op leerlingniveau. Eén van de doelstellingen van de Vlaamse toetsen is de sociale gelijkheid te verhogen. Om deze ambitie waar te maken, zullen de Vlaamse toetsen de leraren voldoende informatie moeten geven over de mate waarin de leerling de eindtermen bereikt heeft.

Het huidige onderzoek leert ons dat wanneer deze koppeling onvoldoende is, er tijdens de interpretatie van de data veel ruimte blijft voor een subjectief oordeel. Daarnaast zullen schoolteams geprofessionaliseerd moeten worden in hoe ze met deze data kunnen omgaan. Het is dus nog afwachten of de Vlaamse toetsen ook in de praktijk de heilige graal voor gelijke onderwijskansen zullen blijken.

Bibliografie

Agirdag, O., Korkmazer, B. (2015). Etnische ongelijkheid in het onderwijs. In Dierckx, D., Coene, J., Raeymaeckers, P., & van der Burg, M. (red.), Armoede en Sociale Uitsluiting. Jaarboek 2015. (pp. 231-249). Leuven: Acco. Geraadpleegd van https://www.researchgate.net/publication/287645260_Etnische_ongelijkhei…

Allal, L. (2013). Teachers’ professional judgement in assessment: a cognitive act and a socially situated practice. Assessment in Education Principles Policy and Practice, 20(1), 20–34. https://doi.org/10.1080/0969594x.2012.736364

Almeida, F. (2018). Strategies to perform a mixed methods study. European Journal of Education Studies, 5(1), 137-151. https://doi.org/10.5281/ZENODO.1406214

Au, W. (2016). Meritocracy 2.0. Educational Policy (Los Altos, Calif.), 30(1), 39–62. https://doi.org/10.1177/0895904815614916

August, D., Carlo, M., Dressler, C., & Snow, C. (2005). The critical role of vocabulary development for English language learners. Learning Disabilities Research & Practice: A Publication of the Division for Learning Disabilities, Council for Exceptional Children, 20(1), 50–57. https://doi.org/10.1111/j.1540-5826.2005.00120.x

Bakker, J., Denessen, E., & Brus-Laeven, M. (2007). Socio‐economic background, parental involvement and teacher perceptions of these in relation to pupil achievement. Educational Studies, 33(2), 177–192. https://doi.org/10.1080/03055690601068345

Barg, K. (2013). The influence of students’ social background and parental involvement on teachers’ school track choices: Reasons and consequences. European Sociological Review, 29(3), 565–579. https://doi.org/10.1093/esr/jcr104

Bol, T., Witschge, J., van de Werfhorst, H. G., & Dronkers, J. (2014). Curricular tracking and central examinations: Counterbalancing the impact of social background on student achievement in 36 countries. Social Forces; a Scientific Medium of Social Study and Interpretation, 92(4), 1545–1572. https://doi.org/10.1093/sf/sou003

Boone, S. (2013). Onderwijsongelijkheden: de confrontatie van gezinnen met een onderwijssysteem. In Eidhof, B., Van Houtte, M. & Vermeulen, M. (red.), Sociologen over onderwijs. Inzichten, praktijken en kritieken. (pp. 219-235). Antwerpen: Garant

Boone, S., & Van Houtte, M. (2013). Why are teacher recommendations at the transition from primary to secondary education socially biased? A mixed-methods research. British Journal of Sociology of Education, 34(1), 20–38. https://doi.org/10.1080/01425692.2012.704720

Brookhart, S. M. (2013). The use of teacher judgement for summative assessment in the USA. Assessment in Education Principles Policy and Practice, 20(1), 69–90. https://doi.org/10.1080/0969594x.2012.703170

Broomes, O. P. (2013). More than a new country: Effects of immigration, home language, and school mobility on elementary students’ academic achievement over time. Education Policy Analysis Archives, 21(48). https://doi.org/10.14507/epaa.v21n48.2013

Calarco, J. M. (2011). “I need help!” social class and children’s help-seeking in elementary school. American Sociological Review, 76(6), 862–882. https://doi.org/10.1177/0003122411427177

Coburn, C. E., & Turner, E. O. (2011). Research on data use: A framework and analysis. Measurement: Interdisciplinary Research and Perspectives, 9(4), 173–206. https://doi.org/10.1080/15366367.2011.626729

De Maeyer, S., van Daal, T., Lesterhuis, M. (2020). Open Leerpakket Meten en Observeren [Ongepubliceerde cursustekst]. Universiteit Antwerpen.

Dunkake, I., & Schuchart, C. (2015). Stereotypes and teacher characteristics as an explanation for the class-specific disciplinary practices of pre-service teachers. Teaching and Teacher Education, 50, 56–69. https://doi.org/10.1016/j.tate.2015.04.005

Ferguson, H., Bovaird, S., & Mueller, M. (2007). The impact of poverty on educational outcomes for children. Paediatrics & Child Health, 12(8), 701–706. https://doi.org/10.1093/pch/12.8.701

Franck E. & Nicaise I. (2018). Ongelijkheden in het Vlaamse onderwijssysteem: verbetering in zicht? Een vergelijking tussen PISA 2003 en 2015. Leuven: HIVA, Gent: SONO, 60p.

Franck, E., Nicaise, I. & Lavrijsen, J. (2017). Extra middelen, meer gelijke onderwijskansen? De effectiviteit van de compensatiefinanciering voor scholen met leerlingen uit kansengroepen onder de loep. Steunpunt Onderwijsonderzoek, KU Leuven

Geven, S., Batruch, A. & van de Werfhost, H. (2018). Inequality in Teacher Judgements, Expectations and Track Recommendations: A Review Study. Amsterdam: Universiteit van Amsterdam

Glock, S., Krolak-Schwerdt, S., & Pit-ten Cate, I. M. (2015). Are school placement recommendations accurate? The effect of students’ ethnicity on teachers’ judgments and recognition memory. European Journal of Psychology of Education, 30(2), 169–188. https://doi.org/10.1007/s10212-014-0237-2

GO! (2022). Standpunt getuigschrift basisonderwijs. Geraadpleegd op 2 januari 2023, van https://pro.g-o.be/blog/Documents/Standpunt%20getuigschrift%20basisonde…

Gunzler, D., Chen, T., Wu, P., & Zhang, H. (2013). Introduction to mediation analysis with structural equation modeling. Shanghai Archives of Psychiatry, 25(6), 390–394. https://doi.org/10.3969/j.issn.1002-0829.2013.06.009

Hays, R. D., Hayashi, T., & Stewart, A. L. (1989). A five-item measure of socially desirable response set. Educational and Psychological Measurement, 49(3), 629–636. https://doi.org/10.1177/001316448904900315

Jæger, M. M. (2011). Does cultural capital really affect academic achievement? New evidence from combined sibling and panel data. Sociology of Education, 84(4), 281–298. https://doi.org/10.1177/0038040711417010

Katholiek Onderwijs Vlaanderen (2021a). Werken aan gelijke onderwijskansen. Geraadpleegd op 2 januari 2023, van https://pro.katholiekonderwijs.vlaanderen/gelijke-onderwijskansen/werke…

Katholiek Onderwijs Vlaanderen (2021b). Klasrapport einde BaO 2020-2021.

Katholiek Onderwijs Vlaanderen (2021c). IDP-stappenplan. Geraadpleegd op 20 maart 2023, van https://pro.katholiekonderwijs.vlaanderen/kwaliteitsinstrumenten/idpsta…

Katholiek Onderwijs Vlaanderen (2022a). Getuigschrift basisonderwijs. Geraadpleegd op 20 maart 2023, van https://pro.katholiekonderwijs.vlaanderen/leerlingen-evalueren-in-het-b…

Katholiek Onderwijs Vlaanderen (2022b). IDP-informatie. Geraadpleegd op 2 januari 2023, van https://pro.katholiekonderwijs.vlaanderen/evaluatiebox-basisonderwijs/i…

Klenowski, V. (2014). Towards fairer assessment. Australian Educational Researcher, 41(4), 445–470. https://doi.org/10.1007/s13384-013-0132-x

Koch, A. J., D’Mello, S. D., & Sackett, P. R. (2015). A meta-analysis of gender stereotypes and bias in experimental simulations of employment decision making. The Journal of Applied Psychology, 100(1), 128–161. https://doi.org/10.1037/a0036734

Lareau, A. (2015). Cultural knowledge and social inequality. American Sociological Review, 80(1), 1–27. https://doi.org/10.1177/0003122414565814

Leighton, J. P. (2004). Avoiding misconception, misuse, and missed opportunities: The collection of verbal reports in educational achievement testing. Educational Measurement: Issues and Practice, 23(4), 6-15. http://dx.doi.org/10.1111/j.1745-3992.2004.tb00164.x

Lopez-Agudo, L. A., González-Betancor, S. M., & Marcenaro-Gutierrez, O. D. (2021). Language at home and academic performance: The case of Spain. Economic Analysis and Policy, 69, 16–33. https://doi.org/10.1016/j.eap.2020.11.003

Lorenz, G. (2021). Subtle discrimination: do stereotypes among teachers trigger bias in their expectations and widen ethnic achievement gaps? Social Psychology of Education: An International Journal, 24(2), 537–571. https://doi.org/10.1007/s11218-021-09615-0

Maerten-Rivera, J., Myers, N., Lee, O., & Penfield, R. (2010). Student and school predictors of high-stakes assessment in science. Science Education, 94(6), 937–962. https://doi.org/10.1002/sce.20408

McMullin, C. (2023). Transcription and qualitative methods: Implications for third sector research. VOLUNTAS International Journal of Voluntary and Nonprofit Organizations, 34(1), 140–153. https://doi.org/10.1007/s11266-021-00400-3

Michelmore, K., & Dynarski, S. (2017). The gap within the gap. AERA Open, 3(1). https://doi.org/10.1177/2332858417692958

Mijs, J. & van de Werfhorst, H. G. (2013). Het onderwijsstelsel en kansengelijkheid: op zoek naar een meritocratie. In Eidhof, B., Van Houtte, M. & Vermeulen, M. (red.), Sociologen over onderwijs. Inzichten, praktijken en kritieken. (pp. 199-217). Antwerpen: Garant

Nieuwenhuis, J., & Hooimeijer, P. (2016). The association between neighbourhoods and educational achievement, a systematic review and meta-analysis. Journal of Housing and the Built Environment, 31(2), 321–347. https://doi.org/10.1007/s10901-015-9460-7

Penninckx, M., Vanhoof, J., Quintelier, A., De Maeyer, S., Van Petegem, P. (2017). Zicht op leerwinst. Scenario’s voor gestandaardiseerde toetsen. Leuven: Acco.

Pit-ten Cate, I. M., Krolak-Schwerdt, S., & Glock, S. (2016). Accuracy of teachers’ tracking decisions: short- and long-term effects of accountability. European Journal of Psychology of Education, 31(2), 225–243. https://doi.org/10.1007/s10212-015-0259-4

Prevoo, M. J. L., Malda, M., Emmen, R. A. G., Yeniad, N., & Mesman, J. (2015). A context-dependent view on the linguistic interdependence hypothesis: Language use and SES as potential moderators. Language Learning, 65(2), 449–469. https://doi.org/10.1111/lang.12099

Reskin, B. F. (2003). Including mechanisms in our models of ascriptive inequality: 2002 presidential address. American Sociological Review, 68(1), 1. https://doi.org/10.2307/3088900

Rogers-Ard, R., Knaus, C. B., Epstein, K. K., & Mayfield, K. (2013). Racial diversity sounds nice; Systems transformation? Not so much. Urban Education, 48(3), 451–479. https://doi.org/10.1177/0042085912454441

Schildkamp, K., & Ehren, M. (2013). Data-based decision making in education: Challenges and opportunities. Dordrecht: Springer

Schildkamp, K., Poortman, C. L., & Handelzalts, A. (2016). Data teams for school improvement. School Effectiveness and School Improvement : An International Journal of Research, Policy and Practice, 27(2), 228–254. https://doi.org/10.1080/09243453.2015.1056192

Steunpunt (2022). Toetsen voor onderwijsontwikkeling. Krachtlijnen voor de centrale toetsen in Vlaanderen. Steunpunt Centrale Toetsen in Onderwijs

Steunpunt Toetsontwikkeling en Peilingsonderzoek (2017). Validering van IDP en de OVSG-toets: Eindrapport. Geraadpleegd op 20 maart 2023, van https://data-onderwijs.vlaanderen.be/documenten/bestand.ashx?id=7760

Timmermans, A. C., Kuyper, H., & van der Werf, G. (2015). Accurate, inaccurate, or biased teacher expectations: Do Dutch teachers differ in their expectations at the end of primary education? The British Journal of Educational Psychology, 85(4), 459–478. https://doi.org/10.1111/bjep.12087

Valcke, M. & Standaert, R. (2018). Onderwijsbeleid in Vlaanderen. Leuven: Acco

van de Werfhorst, H. G. (2015). De achterkant van autonomie: maatwerk, sturing en ongelijkheid. Nederlands Tijdschrift voor Onderwijsrecht en Onderwijsbeleid, December: 286-293.

Van Gasse, R., Vanhoof, J., Mathieu, P., Van Petegem, P. (2015). Informatiegebruik door schoolleiders en leerkrachten. Garant.

Van Laere, E., Aesaert, K., & van Braak, J. (2014). The Role of Students’ Home Language in Science Achievement: A multilevel approach. International Journal of Science Education, 36(16), 2772–2794. https://doi.org/10.1080/09500693.2014.936327

van Leest, A., Hornstra, L., van Tartwijk, J., & van de Pol, J. (2021). Test- or judgement-based school track recommendations: Equal opportunities for students with different socio-economic backgrounds? The British Journal of Educational Psychology, 91(1), 193–216. https://doi.org/10.1111/bjep.12356

Vanlommel, K. (2018). Opening the black box of teacher judgement: The interplay of rational and intuitive processes [Proefschrift]. Universiteit Antwerpen

Vanlommel, K., Van Gasse, R., Vanhoof, J., & Van Petegem, P. (2018). Teachers’ high-stakes decision making. How teaching approaches affect rational and intuitive data collection. Teaching and Teacher Education, 71, 108–119. https://doi.org/10.1016/j.tate.2017.12.011

Vanlommel, K., Van Gasse, R., Vanhoof, J., & Van Petegem, P. (2021). Sorting pupils into their next educational track: How strongly do teachers rely on data-based or intuitive processes when they make the transition decision? Studies in Educational Evaluation, 69(100865), 100865. https://doi.org/10.1016/j.stueduc.2020.100865

Vlaams ministerie van onderwijs en vorming (2016). Getuigschrift basisonderwijs in het gewoon lager onderwijs. Geraadpleegd op 2 januari 2023, van https://onderwijs.vlaanderen.be/nl/ouders/leren-en-evalueren/getuigschr…

Vlaams ministerie van onderwijs en vorming (2017). Toolkit gevalideerde toetsen basisonderwijs. Geraadpleegd op 20 maart 2023, van https://onderwijs.vlaanderen.be/nl/onderwijspersoneel/van-basis-tot-vol…

Vlaamse Regering (2022). Ontwerp van decreet over de Vlaamse toetsen in het onderwijs [Parlementair document]. Brussel: Vlaams Parlement. Geraadpleegd op 6 april 2023, van https://docs.vlaamsparlement.be/pfile?id=1927743 

Wilson, C. (2014). Semi-Structured Interviews. In Interview Techniques for UX Practitioners (pp. 23–41). https://doi.org/10.1016/b978-0-12-410393-1.00002-8

Wolf, E. J., Harrington, K. M., Clark, S. L., & Miller, M. W. (2013). Sample size requirements for structural equation models: An evaluation of power, bias, and solution propriety. Educational and Psychological Measurement, 76(6), 913–934. https://doi.org/10.1177/0013164413495237

Wyatt-Smith, C. & Klenowski, V. (2013). Explicit, latent and  meta-criteria: types of criteria at play in professional judgement practice. Assessment in Education: Principles, Policy & Practice, 20(1), 35-52. https://doi.org/10.1080/0969594X.2012.725030

Download scriptie (630.75 KB)
Genomineerde shortlist Klasseprijs
Universiteit of Hogeschool
Universiteit Antwerpen
Thesis jaar
2023
Promotor(en)
dr. Roos Van Gasse
Thema('s)