Toets wijzer

13 december 2018 | Advies

Samenvatting

Het belang van toetsing en examinering voor de onderwijspraktijk wordt algemeen erkend. Dit leidt tot hoge verwachtingen: toetsing moet bijvoorbeeld het onderwijsleerproces ondersteunen, onbetwistbare ijkpunten bieden binnen het onderwijsstelsel, en meebewegen met veranderingen in de onderwijspraktijk. Ondanks toenemende aandacht voor het verbeteren van de toets- en examenkwaliteit blijft er discussie en debat rondom het thema. Dit heeft geleid tot de volgende adviesvraag van het ministerie van OCW (Onderwijs, Cultuur en Wetenschap) aan de Onderwijsraad: hoe kan het gebruik van toetsing en examinering in het onderwijs worden verbeterd?

Verbeteren toetspraktijk vraagt om meer evenwicht binnen drie dimensies

De raad adviseert de rijksoverheid en de onderwijsinstellingen om toe te werken naar een evenwichtiger toets- en examenpraktijk. De raad heeft de huidige toets- en examenpraktijk in alle onderwijssectoren bestudeerd en concludeert dat deze binnen drie dimensies uit balans is. Om te beginnen is er te weinig ruimte voor formatieve toetsing door grote nadruk op beslissende toetsing. Daarnaast maakt het onderwijs overwegend gebruik van kwantitatieve toetsing, waardoor kwalitatieve toetsmethoden onvoldoende aan bod komen. Dit geldt vooral voor het primair en voortgezet onderwijs, maar ook het middelbaar beroepsonderwijs en hoger onderwijs neigen naar meer kwantitatieve toetsing. Ten slotte ligt er veel nadruk op centraal ontwikkelde toetsing en examinering, waardoor er decentraal (in de onderwijsinstellingen zelf) te weinig eigenaarschap en deskundigheid aanwezig is.

Evenwicht aanbrengen begint met een heldere visie op toetsing en examinering

Een evenwichtige toets- en examenpraktijk vraagt zowel van de rijksoverheid als van onderwijsinstellingen een heldere visie. Vanuit deze visie en de daaruit voortvloeiende verantwoordelijkheden kunnen zowel overheid als instellingen duidelijke kaders bieden, zodat alle betrokkenen de bestaande ruimte voor toetsing en examinering beter kunnen benutten.

Overheid: bied duidelijke kaders aan de onderwijsinstellingen

De rijksoverheid dient vanuit haar stelselverantwoordelijkheid duidelijke kaders te bieden aan onderwijsinstellingen. Deze kaders vormen het tegenwicht voor de eigen toetsing van de onderwijsinstellingen en bepalen daarmee hun ruimte. De raad beschouwt om te beginnen een consistent toets- en examenbeleid als duidelijk kader: de overheid dient rolvast en standvastig te zijn in haar maatregelen. Daarnaast vindt de raad standaardisering van de eindtoetsing voor alle sectoren van belang. Gestandaardiseerde toetsing van de ijkpunten biedt basis- en middelbare scholen ruimte om hun schooleigen toetsing en examinering vorm te geven zoals dat past bij hun eigen onderwijsvisie. Maar ook voor het hoger onderwijs vindt de raad enige mate van standaardisering van eindtoetsing, bijvoorbeeld van bachelorexamens van gelijke opleidingen, het overwegen waard. Een derde kader voor de onderwijsinstellingen wordt gevormd door het toezicht, dat duidelijk maakt aan welke doelen moet worden gewerkt. Met betrekking tot toetsing en examinering ziet de raad voor alle sectoren mogelijkheden tot verbetering van het toezicht.

Als laatste kader adviseert de raad de rijksoverheid om voor primair en voortgezet onderwijs, net als voor middelbaar beroepsonderwijs en hoger onderwijs, toets- en/of examencommissies te verplichten. Daarmee kan de borging van de kwaliteit van toetsing en examinering in deze sectoren verbeterd worden en het eigenaarschap worden vergroot.

Onderwijsinstelling: neem een standpunt in op belangrijke toetsvraagstukken

Voor onderwijsinstellingen is het van belang dat toetsing in lijn wordt gebracht met onderwijsdoelen, onderwijsinhoud en onderwijsmiddelen. Deze integrale benadering van curriculum- en toetsontwikkeling ondersteunt het onderwijsleerproces optimaal en gaat versmalling van het curriculum tegen. Bij het vormgeven van deze eigen visie op toetsing en onderwijsdoelen adviseert de raad om meer ruimte te geven aan de formatieve functie van toetsing, om zo het lesgeven van leraren/docenten en het leerproces van leerlingen/studenten beter te ondersteunen. Daarnaast vindt de raad dat beter en meer gebruikgemaakt kan worden van kwalitatieve toetsmethoden. Ook adviseert de raad om de positie van de examencommissies in het hoger onderwijs nog verder te verbeteren.

Voor een evenwichtige toets- en examenpraktijk is meer toetsdeskundigheid noodzakelijk

Bovengenoemde verbeteringen in de toets- en examenpraktijk kunnen alleen gestalte krijgen als de toetsdeskundigheid in het onderwijs groter wordt. Om dit te realiseren adviseert de raad de rijksoverheid en de beroepsverenigingen om toetsing meer en beter aandacht te geven in de beroepsstandaarden van verschillende groepen onderwijsprofessionals. Hiertoe dienen betere bekwaamheidseisen en richtlijnen op het gebied van toetsing te worden geformuleerd voor leraren en docenten. Deze zijn momenteel onvolledig en weinig concreet, behalve voor het hoger beroepsonderwijs. De daar gehanteerde basis- en seniorkwalificatie examinering zouden als voorbeeld kunnen dienen voor andere sectoren. Ook voor andere groepen onderwijsprofessionals, zoals schoolleiders en lerarenopleiders, dienen standaarden met betrekking tot toetsdeskundigheid te worden geformuleerd. Daarnaast beveelt de raad aan om meer, maar ook gerichter aandacht te geven aan toetsing in lerarenopleidingen en professionaliseringstrajecten. Hierdoor kunnen veel misverstanden over toetsing en examinering worden weggenomen. Als laatste brengt de raad het delen van kennis onder de aandacht. Ook voor leerlingen en studenten en hun ouders is het nuttig om meer inzicht te hebben in het brede belang van toetsing.

1. Aanleiding: toenemend debat en discussie rondom toetsing

Het belang van toetsing voor de onderwijspraktijk wordt algemeen onderkend. Ondanks toegenomen aandacht voor het verbeteren van de kwaliteit van toetsing en examinering, blijft er veel discussie en debat rondom het thema. Hoe kunnen de verwachtingen van toetsing en examinering worden waargemaakt?

Toetsing1 is in alle onderwijssectoren onlosmakelijk verbonden met de praktijk van alledag. De resultaten van toetsen geven informatie die onontbeerlijk is voor het onderwijsleerproces. Er bestaat geen discussie over het belang van toetsing, maar zodra het gaat over de nadere invulling lopen de meningen uiteen.

1.1 Er zijn hoge verwachtingen van toetsing

Onderwijsveld, politiek en maatschappij koesteren hoge verwachtingen van toetsing. Toetsen moeten altijd van onbetwistbare kwaliteit zijn, omdat ze de basis vormen voor belangrijke beslissingen over de toekomst van leerlingen en studenten. Dat toetsing aansluit bij een breed curriculum, waarin niet alleen ruimte is voor kennisoverdracht, maar ook voor doelen op het gebied van socialisatie en persoonsvorming, is voor velen vanzelfsprekend. Verder moet toetsing het onderwijsleerproces ondersteunen, zowel voor leerlingen en studenten als voor leraren en docenten. En ten slotte dient toetsing mee te bewegen met ontwikkelingen op het gebied van personalisering en digitalisering van het onderwijs. Dergelijke verwachtingen leiden tot brede aandacht voor het verbeteren van de kwaliteit van toetsing.

Zo is er in alle sectoren aandacht voor het belang van opbrengstgericht werken, waarbij toetsgegevens een centrale rol innemen. Ook formatief handelen (het ondersteunen van het onderwijsleerproces aan de hand van toetsresultaten) kan rekenen op belangstelling in alle sectoren. In het primair onderwijs zijn daarnaast de ogen gericht op de eindtoets en leerlingvolgtoetsen. In het voortgezet onderwijs geeft de kwaliteit van de centrale examens en van de schoolexamens ieder jaar weer discussie, zowel onder leerlingen als onder vakdocenten en toetsdeskundigen. In het middelbaar beroepsonderwijs wordt vooral gewerkt aan het verbeteren van de kwaliteit van de praktijkexamens. Het hoger onderwijs houdt zich bezig met verbetering van de interne kwaliteitszorg rondom toetsing en examinering.

Wat verstaat de Onderwijsraad onder toetsing?

Toetsing is het gericht verzamelen, interpreteren en gebruiken van informatie over kennis, vaardigheden of houding van een leerling of student, doorgaans aan de hand van één of meerdere opdrachten. Wanneer aan het eind van een opleiding prestaties worden vastgesteld, is er sprake van afsluitende toetsing (ook wel eindtoetsing genoemd). In het hoger onderwijs wordt doorgaans gesproken van tentaminering in plaats van toetsing.

Een specifieke vorm van afsluitende toetsing is examinering. Hierbij wordt op basis van toets- of tentamenprestaties een certificaat of diploma toegekend met een civiel effect. Dat laatste wil zeggen dat de leerling of student met het certificaat of diploma in aanmerking komt voor specifieke vormen van vervolgonderwijs of voor functies in de maatschappij.

1.2 Verwachtingen leiden tot breed gevoerd debat over kwaliteit van toetsing

Toetsing moet dus voldoen aan hoge verwachtingen en er is veel aandacht voor de kwaliteit ervan. Het behoeft daarom niet te verbazen dat toetsing onderwerp is van discussie, zowel in het onderwijsveld als in de politiek en breder in de maatschappij. Deze discussies gaan over verschillende aspecten van de toetspraktijk.

Een eerste thema in het debat is de nadruk op gestandaardiseerde toetsing in het onderwijs. Met gestandaardiseerde toetsen is het mogelijk om leerlingen, klassen en scholen met elkaar te vergelijken. Voorstanders van gestandaardiseerde toetsing beargumenteren dat dit een opbrengstgerichte aanpak van het onderwijs stimuleert en daarmee bijdraagt aan kwaliteitsverbetering. In het onderwijs worden gestandaardiseerde toetsen steeds vaker verplicht gesteld. In het primair onderwijs gaat het daarbij om een gestandaardiseerde eindtoets en gestandaardiseerde voortgangstoetsen. In het voortgezet onderwijs zijn de exameneisen aangescherpt. Gestandaardiseerde toetsing wordt vooral, maar niet alleen, gebruikt wanneer toetsing een beslissende functie heeft. Gestandaardiseerde toetsing in het funderend onderwijs geeft volgens de voorstanders duidelijke referentiepunten voor kwaliteitsbeoordeling, doorstroom en civiel effect van diploma’s.2

De nadruk op beslissende, gestandaardiseerde en kwantitatieve toetsing leidt tot een tegenbeweging. Tegenstanders stellen dat deze nadruk een strategische aanpak uitlokt, die leidt tot ‘versmalling’ van de onderwijskwaliteit, aantasting van de pluriformiteit van het onderwijs, en excessieve aandacht voor toetsen.3 Sommige van deze tegenstanders wijzen toetsing volledig af of pleiten voor alleen nog formatief toetsen. Een meer gematigde stellingname is dat toetsing ten dienste moet staan van de brede opbrengsten die het onderwijs nastreeft op de terreinen van kwalificatie, socialisatie en persoonsvorming. Dat betekent dat naast cognitieve, vaak kwantificeerbare opbrengsten ook andersoortige opbrengsten zichtbaar moeten worden gemaakt, zo nodig op kwalitatieve wijze.4

Een aan standaardisering gerelateerd thema in het debat is het centraliseringsvraagstuk. Wat moet er centraal worden getoetst en wat mogen onderwijsinstellingen zelf vormgeven qua toetsing en examinering? Dit onderwerp is nauw gerelateerd aan dat van autonomie van onderwijsinstellingen en krijgt veel aandacht in het debat. Welke ijkpunten zijn noodzakelijk om die autonomie te kunnen blijven garanderen? Hoe kan de overheid haar stelselverantwoordelijkheid voor de kwaliteit van het onderwijs centraal waarmaken? Het hoger onderwijs heeft bijvoorbeeld veel ruimte voor eigen invulling. Dit is positief voor het eigenaarschap en de betrokkenheid van docenten, maar brengt uitdagingen met zich mee voor de vergelijkbaarheid van diploma’s en mogelijke nadelige gevolgen voor gelijke kansen op de arbeidsmarkt.

Een ander thema in het debat is de toenemende verantwoording die onderwijsinstellingen moeten afleggen over de kwaliteit van de toetsen die zij voor beslissende doeleinden gebruiken. In het hoger onderwijs zijn de afgelopen jaren de eisen aan examencommissies en aan de deskundigheid van hun leden aangescherpt. De verantwoordingsplicht heeft consequenties voor de vorm van de toetsing. Toetsen moeten zowel valide als betrouwbaar zijn en de afname moet objectiveerbaar en kwantificeerbaar zijn. Dat is echter niet altijd mogelijk. Door de verantwoordingsplicht kunnen toetsen waarbij leerlingen bijvoorbeeld houdingsaspecten en vaardigheden in (semi)realistische beroepssituaties demonstreren, onder druk komen te staan. Opleidingen kiezen vanwege de verantwoordingsplicht namelijk eerder voor toetsen waarbij de nadruk ligt op betrouwbaarheid en kwantificeerbaarheid.

Ook is er in het debat aandacht voor de groeiende variatie in toetsen. Dat heeft onder andere te maken met de omslag van een aanbodgestuurde naar een meer vraaggestuurde markt van leermiddelen.5 Scholen voor primair onderwijs kunnen naast de centrale eindtoets van het Cito nu bijvoorbeeld ook kiezen voor één van de vijf alternatieve erkende eindtoetsen. Ook voor leerlingvolgtoetsen zijn er verschillende aanbieders. Bovendien hanteert elke methode in het primair en voortgezet onderwijs zijn eigen toetsing. In het middelbaar beroepsonderwijs is sprake van ontwikkeling van toetsing door externe organisaties. In het hoger onderwijs is het mogelijk dat iedere docent zijn of haar eigen toetsen maakt. De markt voor toetsing en examinering is niet altijd transparant en dit kan gevolgen hebben voor de kwaliteit en de doorstroom naar vervolgonderwijs.

Een laatste belangrijk thema in het debat is de digitalisering van toetsen. Digitalisering kan uiteenlopende vormen aannemen en verschillende consequenties hebben voor de toetsing. Leerlingen/studenten en leraren/docenten kunnen eigenaar worden van de toetsing omdat zij zelf de aard, het moment en de locatie ervan kunnen bepalen, alsmede de toetsgegevens kunnen beheren in de vorm van een digitaal portfolio. Daarnaast kunnen digitale toetsen een adaptief karakter hebben, wat betekent dat de moeilijkheid van toetsvragen wordt aangepast aan de gegeven antwoorden.6

Naast bovengenoemde inhoudelijke discussiepunten klinken er kritische geluiden over de veelheid aan toetsen die leerlingen en studenten moeten maken en de toetsdruk die hierdoor kan ontstaan, over het belang dat aan toetsing wordt gehecht, en over de mogelijk negatieve gevolgen van toetsing. De gezamenlijke noemer in bovenstaande kritiek- en discussiepunten is dat toetsing een doel op zich lijkt te zijn geworden, waarbij nut en noodzaak buiten beeld verdwijnen.

1.3 Adviesvraag: hoe kan het gebruik van toetsing worden verbeterd?

De toenemende discussie over verschillende aspecten van toetsing en examinering heeft geleid tot de adviesvraag van het ministerie van OCW (Onderwijs, Cultuur en Wetenschap) over de rol en invulling van toetsing en examinering in het onderwijs.

De adviesvraag luidt:Hoe kan het gebruik van toetsing en examinering in het onderwijs worden verbeterd?

De raad gaat in dit advies in op toetsing en examinering in alle sectoren, van het primair onderwijs tot en met het wetenschappelijk onderwijs. Het accent in het advies ligt op de rol en verantwoordelijkheden van betrokkenen uit het onderwijsveld en van de rijksoverheid. De raad geeft daarbij richtlijnen over visie, eigenaarschap, verantwoordelijkheden en deskundigheid die de kwaliteit van toetsing en examinering ten goede komen.

1.4 Totstandkoming van dit advies

Voor het tot stand komen van dit advies is literatuuronderzoek verricht en een analyse van relevante beleidsdocumenten gemaakt. Er zijn panelgesprekken gevoerd met diverse groepen betrokkenen uit alle onderwijssectoren, waaronder leraren en docenten, schoolleiders/directeuren en bestuurders. Daarnaast zijn individuele gesprekken gevoerd met diverse andere deskundigen, waaronder vertegenwoordigers van belangen- en sectororganisaties. Er heeft een onderwijsdialoog plaatsgevonden met inleiders, discussianten en deelnemers uit alle sectoren. Ook heeft de Onderwijsraad op zijn website een oproep gedaan om over het advies mee te denken, waarop verschillende reacties zijn verkregen. Een overzicht van gesprekspartners is opgenomen achterin dit advies. Tot slot zijn diverse bijeenkomsten bezocht rondom het thema toetsing en examinering.

2. Hoofdboodschap: werk toe naar een evenwichtiger toetspraktijk

Het verbeteren van de huidige toets- en examenpraktijk vraagt om evenwicht. Evenwicht tussen formatieve en beslissende toetsing, tussen centrale en decentrale toetsing, en tussen kwantitatieve en kwalitatieve toetsing.

De toetspraktijk krijgt vorm door uiteenlopende keuzes die op verschillende niveaus van het onderwijssysteem worden gemaakt. De raad adviseert de rijksoverheid en onderwijsinstellingen om geen eenzijdige keuzes te maken, maar te streven naar een evenwichtige toetspraktijk. Hierin krijgen bijvoorbeeld zowel de borging van het civiel effect van diploma’s als het genereren van rijke feedback voor het leerproces een plaats. De raad constateert dat de huidige toetspraktijk in verschillende opzichten uit balans is. Om deze balans aan te brengen is een integrale benadering nodig, met als belangrijkste doel dat toetsing een bijdrage levert aan de onderwijskwaliteit, aan de onderwijsloopbaan van leerlingen en studenten en aan toekomstig functioneren op de arbeidsmarkt en in de maatschappij.

2.1 Een evenwichtige toetspraktijk draagt bij aan onderwijskwaliteit

De raad pleit voor een evenwichtiger toetspraktijk die beter ten dienste staat van de onderwijskwaliteit. Deze toetspraktijk dient verschillende doelen. Voor leerlingen en studenten heeft toetsing als doel om feedback te krijgen over hun leerproces en om inzicht te krijgen in hun vorderingen. Ook speelt toetsing een belangrijke rol bij de overgangen in hun onderwijsloopbaan. Voor leraren en docenten biedt toetsing inzicht in hoe hun onderwijs aansluit bij de leerlingen en studenten en waar verbeterpunten liggen. Voor onderwijsinstellingen geeft toetsing zicht op de kwaliteit van het onderwijs en ondersteunt het beslissingen over bevordering naar een volgend leerjaar en toekenning van een diploma. Daarmee heeft toetsing ook op maatschappelijk niveau een belangrijk doel, namelijk toeleiding naar vervolgopleidingen of de beroepspraktijk.7 Bovendien gebruikt de rijksoverheid toetsing om zicht te krijgen op de kwaliteit van het onderwijs, zowel van individuele onderwijsinstellingen als van het stelsel in zijn totaliteit.

Deze doelen van toetsen en examineren staan soms op gespannen voet met elkaar. De raad onderkent bij deze spanningen drie dimensies:

  • de mate waarin toetsing een beslissende of formatieve functie heeft;
  • de mate waarin toetsing op decentraal niveau of (meer) centraal niveau wordt vormgegeven; en
  • de mate waarin wordt gestreefd naar kwantitatieve meting of naar het meer op kwalitatieve wijze zichtbaar maken van onderwijsopbrengsten.

Wat de juiste balans is binnen de bovengenoemde dimensies verschilt per onderwijssector, maar voor elke sector geldt dat een balans binnen elk van de dimensies de beste garantie is dat toetsing daadwerkelijk een bijdrage leveren aan de onderwijskwaliteit en de onderwijs- en maatschappelijke loopbaan van leerlingen en studenten.

De drie dimensies kunnen niet los van elkaar bekeken worden en vragen om een integrale benadering. Veranderingen binnen de ene dimensie hebben gevolgen voor het evenwicht binnen een andere dimensie. Het is in de praktijk wel vaak zo dat centrale, beslissende en kwantitatieve toetsing samengaan, evenals formatieve, decentrale en kwalitatieve toetsing. Een onderliggende dimensie is dan standaardisering (gelijkschakeling) versus variatie. Toch zijn er ook andere combinaties mogelijk. Zo vindt het centraal schriftelijk en praktisch examen in het vmbo (voorbereidend middelbaar beroepsonderwijs) grotendeels op kwalitatieve wijze plaats, maar wel aan de hand van centraal vormgegeven praktische toetsopdrachten. En gestandaardiseerde kwantitatieve toetsen kunnen ook voor formatieve doeleinden worden gebruikt, zoals gebeurt bij digitale adaptieve toetsen.8

Het pleidooi voor een balans binnen deze drie dimensies betekent niet dat de raad voorstelt om de huidige toetspraktijk radicaal anders in te richten. Hij vindt het van belang dat het goede uit de huidige toetspraktijk behouden blijft. Tegelijkertijd dienen er maatregelen genomen te worden die het evenwicht verbeteren.

Formatieve versus beslissende functies van toetsing

Toetsing kan uiteenlopende functies vervullen.9 Deze functies kunnen grofweg in twee categorieën worden ingedeeld: beslissende en formatieve functies. De beslissende functies worden in het onderwijsveld ook wel aangeduid als summatieve functies.10 De raad kiest voor de term beslissende functies in plaats van summatieve functies, omdat er verwarring over de term summatief bestaat. Formatieve toetsing kan namelijk ook gebaseerd worden op summatieve oordelen, de twee sluiten elkaar niet uit.11

Beslissende functies verwijzen naar het gebruik van resultaten van toetsen of examens om beslissingen te nemen. Beslissingen kunnen in de eerste plaats betrekking hebben op leerlingen/studenten. Het gaat dan om zaken als bevordering, toelating, selectie en certificering. Beslissingen op basis van toetsresultaten kunnen daarnaast betrekking hebben op docenten of onderwijsinstellingen. Het gaat dan bijvoorbeeld over het beoordelen van het functioneren van onderwijspersoneel, de toekenning van financiën en het opleggen van maatregelen om de onderwijskwaliteit te verbeteren. In alle gevallen staat er iets op het spel.

Bij de formatieve functies van toetsing gaat het om initiëren, vormgeven en optimaliseren van het onderwijs. Toetsen worden dan gebruikt om specifieke leerbehoeften van leerlingen vast te stellen, feedback te geven en daarmee uiteindelijk het onderwijs te verbeteren. Toetsing is in dit opzicht zowel ondersteunend voor het zelfstandig leren van leerlingen als voor de interne kwaliteitszorg van het onderwijs. Toetsing kan het leer- en onderwijsproces tot op zekere hoogte ook initiëren doordat het richting geeft (er wordt naar de toets of het examen toegewerkt, de toetsen en examens functioneren als een concretisering van de leerdoelen) en motiveren (de toets vormt een uitdaging, men spant zich tijdens en voorafgaand aan de toets in om het toetsresultaat te optimaliseren).

Decentrale versus (meer) centrale toetsing

Bij het bepalen van het toetsbeleid moeten keuzes gemaakt worden ten aanzien van vormgeving (het ontwerp, de afname, de beoordeling en het gebruik van toetsresultaten), inhoud (als weerspiegeling van de onderwijsdoelen), kwaliteitsbeleid en organisatie. Deze keuzes kunnen decentraal door de leraar/docent of meer op centraal niveau worden gemaakt, bijvoorbeeld door een groep van instellingen of nog centraler door een instantie van of namens de rijksoverheid.

Zowel centralisering als decentralisering van toetsing heeft voordelen. Decentralisering van de toetsing maakt het mogelijk de toets op maat te snijden van de specifieke groep leerlingen/studenten en het onderwijs dat ze hebben gevolgd. Leraren/docenten blijven daarnaast zeggenschap houden over een belangrijk onderdeel van hun onderwijs. Dat draagt bij aan het gevoel van eigenaarschap en heeft een motiverende werking.12 Decentrale vormgeving van toetsing versterkt bovendien de mogelijkheden voor het aanbrengen van eigen accenten door onderwijsinstellingen en individuele leraren/docenten. Wanneer een docent zelf zijn of haar toetsen vormgeeft, is er sprake van volledige decentralisering.13 Er zijn echter ook tussenvormen, bijvoorbeeld als docenten worden betrokken bij de keuze van toetsen en de manier waarop zij worden ingezet. Dit is bijvoorbeeld het geval in het hoger onderwijs, via examen- of opleidingscommissies. Inspraak bij de vormgeving, de organisatie en de kwaliteitszorg kan ook bijdragen aan eigenaarschap en maakt de toetsing ten dele decentraal.

Een belangrijk voordeel van centralisering van de toetsing is de standaardisering. Gestandaardiseerde toetsing op de ijkpunten, zoals bijvoorbeeld in het funderend onderwijs gangbaar is, maakt het mogelijk om toetsprestaties van instellingen met elkaar te vergelijken. En de individuele leerling/student kan eigen toetsresultaten vergelijken met een grotere populatie. Bij digitale adaptieve toetsvormen zijn dergelijke vergelijkingen in het computerprogramma verwerkt, zodat leerlingen/studenten automatisch een afgestemd aanbod van feedback, instructie en nieuwe toetsopgaven krijgen.14 Vergelijkbare resultaten maken het ook mogelijk voor onderwijsinstellingen, de rijksoverheid en de maatschappij als geheel om door de tijd heen zicht te houden op de onderwijskwaliteit en kwaliteitsbeleid te voeren. Een ander voordeel van standaardisering is dat dit een objectieve en transparante basis kan bieden bij belangrijke beslissingen, zoals het geven van schooladviezen of toekennen van diploma’s. Dit is zowel voor individuele leerlingen/studenten als voor de maatschappij in het algemeen van belang: diploma’s hebben op die manier een civiel effect.15

Kwantitatieve versus kwalitatieve methoden van toetsen

Toetsen kan op kwantitatieve of kwalitatieve wijze. Een toets met gesloten vragen en een vast correctiemodel is kwantitatief. De beoordeling is te herleiden tot (deel)scores en het maakt in principe voor de beoordeling niet uit wie de toets nakijkt. Dat is anders bij kwalitatieve toetsen, zoals een mondeling tentamen, een presentatie of een werkstuk. De beoordelaar moet hierbij beschrijvende informatie of observaties interpreteren. Deze interpretaties vergen inhoudelijke expertise en zijn tot op zekere hoogte subjectief. De interpretaties kunnen beschrijvend zijn of uiteindelijk wel weer naar scores of deelscores worden vertaald.16

Lange tijd is gedacht dat het voor het verkrijgen van betrouwbare en objectieve informatie noodzakelijk was toetsing vergaand te standaardiseren en te kwantificeren en de rol van de beoordelaar te minimaliseren. Een recenter inzicht is dat betrouwbaarheid niet noodzakelijk standaardisatie vereist en vooral het resultaat is van het combineren van verschillende toetsen, bij voorkeur met gevarieerde methoden.17 Bovendien wordt objectiviteit niet noodzakelijkerwijs verkregen door de rol van de beoordelaar te minimaliseren, maar kan objectiviteit ook worden bereikt door verschillende beoordelaars in te zetten, studenten onderling elkaars werk te laten vergelijken, trainingen te geven, of producten van leerlingen/studenten paarsgewijs te vergelijken.18

Kwantitatieve en kwalitatieve toetsen kunnen beide bijdragen aan het zichtbaar maken van onderwijsopbrengsten en hebben elk specifieke voordelen. Kwantitatieve toetsen zijn bijvoorbeeld met name geschikt om vergelijkingen te maken tussen grotere groepen leerlingen/studenten. Ze zijn doorgaans ook goedkoper en praktischer, mede doordat ze een kleiner beroep doen op vakdeskundigheid en het nakijken geautomatiseerd kan worden. Kwalitatieve toetsen zijn vooral geschikt om complexere vaardigheden te toetsen. Spreekvaardigheid kan bijvoorbeeld alleen kwalitatief worden getoetst. Kwalitatieve toetsen nemen meestal meer tijd in beslag, bijvoorbeeld omdat ze individueel moeten worden afgenomen. Ze kunnen echter ook een besparing van toetstijd opleveren, omdat vaardigheden geïntegreerd kunnen worden getoetst. Kwalitatieve methoden resulteren in rijke informatie die kan worden ingezet voor feedback of voor het vaststellen van individuele leerbehoeften en maatwerk in gebruik van lesmateriaal.

2.2 Huidige toetspraktijk is niet evenwichtig

De raad constateert dat er binnen de huidige toetspraktijk sprake is van onevenwichtigheden binnen de verschillende dimensies. De nadruk ligt op de beslissende functie van toetsing en op kwantitatieve toetsvormen. Hieronder zijn de algemene bevindingen per dimensie van toetsing en examinering weergegeven. Gedetailleerdere beschrijvingen van de disbalans per sector zijn te vinden in het katern Voorbeelden van onevenwichtigheden in de toetspraktijk.

Formatieve toetsing komt nog onvoldoende aan bod

De raad constateert dat toetsing vooral beslissende functies heeft en dat er minder aandacht is voor de formatieve functies. In het primair onderwijs is veel aandacht voor de beslissende functies van de methodegebonden toetsen, de leerlingvolgtoetsen en de eindtoets. Kan een leerling door naar een volgend leerboekje, naar een volgend niveau, naar de volgende groep, naar het voortgezet onderwijs? Uit veldraadplegingen in het funderend onderwijs blijkt dat scholen de formatieve mogelijkheden van dergelijke toetsen, zoals feedback voor leerlingen en bepaling van individuele onderwijsbehoeften, niet altijd goed benutten. In het hoger onderwijs is er door de beslissende toetsing (per vak een tentamen) minder aandacht voor formatieve toetsing dan gewenst. Beslissende toetsing vraagt veel tijd en aandacht, en dit gaat ten koste van de mogelijkheid om via toetsing feedback te verkrijgen die het leren en het onderwijs kan ondersteunen.19 Naast feedback krijgen ook andere formatieve functies weinig aandacht. Toetsen worden bijvoorbeeld zelden gekozen omdat ze leerlingen/studenten motiveren of het zelfstandig leren bevorderen. Andersom geldt dat de nadruk op beslissende functies op termijn de intrinsieke motivatie van leerlingen en studenten kan verminderen en kan bijdragen aan een passieve leerstijl.20

De raad constateert echter ook dat er soms juist te weinig aandacht uitgaat naar de beslissende functie van toetsing. In elk van de sectoren blijven grote onderdelen van de onderwijsdoelen ongetoetst of wordt de toetsing beperkt meegenomen in beslissingen over bevordering, selectie/schooladvisering en diplomatoekenning. In het funderend onderwijs geldt dit bijvoorbeeld voor productieve taalvaardigheden: schrijven en mondeling presenteren zijn onderbelicht in de eindtoetsing. Hetzelfde geldt voor brede vorming in alle onderwijssectoren: er vindt verhoudingsgewijs weinig toetsing met een beslissende functie op de onderwijsdoelen van de domeinen socialisatie en persoonsvorming plaats. Doordat deze belangrijke doeldomeinen van het onderwijs weinig aan bod komen in toetsing en leraren en docenten geneigd zijn hun onderwijs aan te passen aan dat wat wordt getoetst21, treedt er een onwenselijke versmalling van het onderwijs op.22

Centrale vormgeving van toetsing in verschillende opzichten uit balans

In de huidige toetspraktijk is er nog geen goede balans tussen centrale en decentrale vormgeving van toetsing. In het voortgezet onderwijs begeleidt Cito de ontwikkeling van centrale examens en gebruiken docenten vaak methodegebonden toetsen om leerlingen tussentijds te volgen. Het schoolexamen wordt wel door scholen zelf vormgegeven, maar lijkt in veel gevallen op het centraal schriftelijk examen. In het hoger onderwijs is de vormgeving van de examinering juist nauwelijks gecentraliseerd, terwijl de studiepaden door individualisering en maatwerk steeds verder uiteenlopen. Dit zorgt ervoor dat de borging van de eindkwalificaties en de vergelijkbaarheid van diploma’s onder druk komen te staan. In het middelbaar beroepsonderwijs en het primair onderwijs is er sprake van weer een andersoortige disbalans. In deze sectoren is de toetsing voor een groot deel uitbesteed aan toetsaanbieders. De toetsing is daardoor geheel of verregaand gestandaardiseerd. In sommige opzichten draagt dit bij aan de toetskwaliteit. Voor leraren/docenten heeft deze centrale uitbesteding echter een vervreemdend effect omdat zij weinig zeggenschap hebben over een wezenlijk onderdeel van hun onderwijs.23

Kwalitatieve toetsmethoden krijgen te weinig aandacht

Ook binnen de dimensie kwalitatieve versus kwantitatieve toetsen neemt de raad een disbalans waar. In het primair en voortgezet onderwijs zijn eindtoetsen en examens doorgaans kwantitatief en gericht op afzonderlijke, goed meetbare kennis en deelvaardigheden.24 Kwalitatieve methoden van toetsen, het genereren van rijke feedback voor leerlingen, en het toetsen van brede onderwijsdoelen komen daarmee zoals eerder opgemerkt in het gedrang. In het middelbaar beroepsonderwijs en het hoger onderwijs is er weliswaar een betere balans tussen kwalitatieve en kwantitatieve methoden, maar ook daar is er niet altijd sprake van evenwichtig gebruik van verschillende vormen van toetsing. Geïntegreerde toetsing van kennis en vaardigheden krijgt een belangrijke plaats in proeven van bekwaamheid, scripties en essaytoetsen. Niettemin bestaat ook in deze sectoren de neiging om meer kwantitatieve methoden te gebruiken. Een voorbeeld is de tendens om uitvoerige checklists te gebruiken en toetsen consequent te voorzien van deelscores en totaalscores.25 Deze vergaande kwantificering is niet altijd wenselijk, zeker niet wanneer toetsing vooral een formatieve functie heeft en de aandacht van de student gericht moet zijn op feedback op haar of zijn werk.

Voorbeelden van onevenwichtigheden in de toetspraktijk

De toetspraktijk is de afgelopen decennia veranderd. In het primair onderwijs zijn gestandaardiseerde eindtoetsen en volgtoetsen ingevoerd. In het voortgezet onderwijs zijn de eisen van het centraal schriftelijk examen aangescherpt. In het middelbaar onderwijs zijn kwalificatiedossiers ingevoerd en verbonden aan de toetsing en wordt toetsontwikkeling uitbesteed aan gecertificeerde organisaties. In het hoger onderwijs hebben modularisering en de invoering van de bachelor-masterstructuur tot tentaminering per vak geleid. Deze ontwikkelingen hebben om goede redenen plaatsgevonden, maar hebben de toetspraktijken in verschillende opzichten uit evenwicht gebracht.

Primair onderwijs

In het primair onderwijs vormen eindtoetsen en volgtoetsen een belangrijk onderdeel van de onderwijspraktijk. De gestandaardiseerde toetsen maken het mogelijk zinvolle vergelijkingen te maken tussen (groepen) leerlingen, scholen en leerjaren. Op basis van deze vergelijkingen zijn de afgelopen jaren steeds meer leraren, scholen en schoolbesturen opbrengstgericht gaan werken. Hierbij worden aan de hand van toetsresultaten doelen geëvalueerd (en bijgesteld) en fungeren de referentieniveaus die aan de toetsen zijn verbonden als ijkpunten waar betrokkenen naar toe werken.26 Het minimumniveau van basisvaardigheden is door deze werkwijze beter geborgd.27 De focus van de eindtoetsen en volgtoetsen op basale reken- en taalvaardigheden zorgt echter ook voor een versmalling van het onderwijs. Bredere opbrengsten, bijvoorbeeld op het gebied van socialisatie en persoonsvorming, waarvan de laatste jaren het belang wordt beklemtoond, krijgen nog weinig aandacht in de toetsing.28

De nadruk die bij volgtoetsen is komen te liggen op schooladvisering, gaat bovendien ten koste van andere functies die toetsen zouden kunnen vervullen, zoals het vaststellen van specifieke onderwijsbehoeften van leerlingen of het bieden van rijke feedback. Doordat dergelijke functies zijn onderbelicht bij het ontwerp en gebruik van de volgtoetsen, bieden zij weinig aangrijpingspunten voor leerling en docent bij het afstemmen van de leerstrategie en de didactisch aanpak. Dat maakt het lastig om toetsresultaten van volgtoetsen daadwerkelijk in te zetten voor opbrengstgericht werken op het niveau van de individuele leerling of de groep.29

Historische ontwikkelingen in de toetspraktijk van het primair onderwijs

Het gebruik van gestandaardiseerde toetsen in het Nederlandse basisonderwijs gaat terug naar de jaren zestig van de vorige eeuw, toen het Cito (Centraal Instituut voor Toetsontwikkeling) werd opgericht. Het Cito werd verantwoordelijk voor de ontwikkeling van een toets met meerkeuzevragen om leerkrachten te ondersteunen bij het geven van een passend advies over de meest geschikte vervolgopleiding van hun leerlingen (de eindtoets). De toets werd onder meer ingevoerd omdat er zorgen waren over de subjectiviteit van beoordelingen door leerkrachten.30 Behalve de eindtoets hebben ook volgtoetsen hun intrede gedaan in het onderwijs. Met deze toetsen kan het vaardigheidsniveau gedurende de basisschoolperiode worden gevolgd. Inmiddels zijn scholen verplicht zowel een eindtoets af te nemen als een leerlingvolgsysteem te gebruiken, maar zijn er verschillende varianten en aanbieders waartussen ze kunnen kiezen.

De eindtoetsen zijn geijkt aan de referentieniveaus taal en rekenen, aan de hand waarvan kan worden gekeken of een leerling aan het vereiste basisniveau voldoet.31 Daarnaast zijn ze ook zodanig gestandaardiseerd dat zinvolle vergelijkingen kunnen worden gemaakt tussen leerlingen, tussen scholen en tussen leerjaren. Om praktische redenen en om gestandaardiseerde meting beter mogelijk te maken bevatten de toetsen voornamelijk meerkeuzevragen en richten ze zich overwegend op taal- en rekenvaardigheden. Sommige eindtoetsen en volgtoetssystemen bevatten ook open vragen of adresseren onderdelen als wereldoriëntatie en sociaalemotionele ontwikkeling.

Vanaf het schooljaar 2014-2015 is het afnamemoment van de eindtoets naar achteren geschoven, waardoor de toets op een andere manier wordt meegewogen voor het schooladvies. Hiertegenover staat dat veel scholen de volgtoetsen, en dan met name de volgtoetsen van groep 7, gebruiken als objectieve basis om het schooladvies te onderbouwen. De Inspectie voert inmiddels het beleid om vanuit haar stimulerende rol ‘verder te kijken’ dan resultaten op de eindtoets, maar dat neemt niet weg dat deze toetsen een belangrijke rol blijven vervullen in het toezichtkader. Lage gemiddelde scores voor taal en rekenen op de eindtoets zijn aanleiding voor de Inspectie om nader onderzoek te doen naar de onderwijskwaliteit. Scholen zijn eraan gewend geraakt om te focussen op deze kwaliteitsindicatoren.

Voortgezet onderwijs

In het voortgezet onderwijs heeft het centraal schriftelijk examen een belangrijke functie. Met de kernvakkenregeling zijn de eisen van het centraal schriftelijk examen aangescherpt en hebben de kernvakken een groter gewicht gekregen bij de beslissing of een kandidaat slaagt of zakt (zie tekstkader). Daarnaast is de Inspectie scherper toezicht gaan houden op slagingspercentages en cijfers op de centrale examens. De normen hiervoor zijn de afgelopen jaren geleidelijk aangepast.32 Ten slotte is de Inspectie er sinds 2009 onder meer op gaan toezien dat op een school de cijfers van de schoolexamens gemiddeld over een periode van drie jaar niet meer dan een halve punt van de cijfers van de centrale examens verschillen. Onderzoek uit 2013 laat zien dat schoolleiders hier scherper op sturen dan is vereist; ze kijken niet alleen naar het gemiddelde over drie jaar, maar ook naar het verschil per jaar en per vak.33 De verschillende maatregelen die zijn ingevoerd om de examenkwaliteit te borgen, hebben voor een betere examenkwaliteit gezorgd, maar hebben ook ongewenste neveneffecten. Een daarvan is dat op veel scholen het schoolexamen steeds meer op het centraal schriftelijk examen is gaan lijken; het schoolexamen is gaan dienen als een oefening voor het centraal schriftelijk examen. Dit heeft, zoals de raad al eerder constateerde, een versmalling van de toetspraktijk en het onderwijs tot gevolg.

De toetsing vindt doorgaans klassikaal, schriftelijk en per vak plaats, waarbij vooral de individuele cognitieve prestatie telt en wordt gewaardeerd met een cijfer. Het veelvuldig afnemen van toetsen ‘voor een cijfer’ dient niet alleen om beter vast te stellen wat het prestatieniveau is, maar is voor sommige docenten ook een stok achter de deur om leerlingen aan het werk te houden. Omdat de leerlingen ook niet anders verwachten, zijn ze vooral bereid zich in te spannen voor die toetsen die mee tellen. Daarbij hebben leerlingen doorgaans een begrijpelijke voorkeur voor kwantitatieve toetsmethoden, omdat de beoordeling daarvan transparant en objectief is.

Deze toetspraktijk loopt echter uit de pas met innovaties in het onderwijs als flexibilisering van leertrajecten, meer aandacht voor vakoverstijgende vaardigheden en interdisciplinaire onderwerpen, zelfstandig leren, werken in groepjes en de inzet van digitale middelen.34 De huidige integrale curriculumherziening brengt hier mogelijk verandering in, maar er is een risico dat deze curriculumherziening stagneert wanneer de toetsing onvoldoende meeontwikkelt.35 Een punt van zorg van de raad is dat toetsvraagstukken vooralsnog onvoldoende zijn meegenomen in de huidige landelijke curriculumherziening.36 De raad adviseert in zijn Briefadvies curriculumvernieuwing om toetsvraagstukken op te nemen in curriculumvernieuwing, met een permanente commissie die dit proces monitort en adviseert over herijking als uit periodieke scans blijkt dat dit noodzakelijk is.37

Historische ontwikkelingen in de toets- en examenpraktijk van het voortgezet onderwijs

Met de invoering van de Mammoetwet in 1968 zijn centrale examens in combinatie met schoolexamens de uiteindelijke cijfers op het examen gaan bepalen.38 De centrale examens fungeren daarbij als objectief ijkpunt, terwijl de schoolexamens ruimte aan scholen bieden om de toetsing van hun eigen onderwijsdoelen te realiseren. De Mammoetwet betekende ook een verkleining van het aantal examenvakken (met wel zwaardere eisen) en gaf de leerlingen de mogelijkheid om vakken te kiezen. De keuzevrijheid is geleidelijk aan iets ingeperkt en het aantal examenvakken is toegenomen, wanneer de ‘kleine vakken/onderdelen’ zonder centraal schriftelijk examen worden meegerekend.39 Sinds de invoering van de tweede fase in 1999 dienen leerlingen in ieder geval examen te doen voor de kernvakken (waaronder Nederlands, Engels en wiskunde40), hun profielvakken en een vak naar keuze (vrij deel).

Voorafgaand aan de aanpassing van de zak-slaagregeling in 2011 was het mogelijk dat een leerling met onvoldoendes op het centrale examen voor alle vakken, dankzij hoge schoolexamencijfers toch slaagde voor het eindexamen. De kwaliteit van schoolexamens was niet altijd optimaal en sommige scholen maakten schoolexamens systematisch gemakkelijker dan het centraal schriftelijk examen.41

Om deze redenen ging de Inspectie er vanaf 2009 op letten dat het verschil tussen schoolexamen en centraal schriftelijk examen op een school niet meer dan een half punt bedraagt. Daarnaast werd in 2011 de zak-slaagregeling aangepast, waarbij het gemiddeld centraal examencijfer een 5,5 of hoger moet zijn om in aanmerking te komen voor het diploma. Ook werd de zogeheten kernvakkenregeling ingevoerd, die voor havo en vwo inhoudt dat leerlingen voor de vakken Nederlands, Engels en wiskunde ten hoogste één 5 mogen staan. Voor het vmbo geldt eenzelfde regeling voor Nederlands.

Sinds 2016 is de indicator van het verschil tussen schoolexamen en centraal schriftelijk examen geschrapt uit het resultatenmodel van de Inspectie, omdat de zak-slaagregeling en de bepalingen over kernvakken de indicator overbodig maakten. Bovendien had de indicator het ongewenste effect dat de schoolexamens meer op de centrale examens gingen lijken.42 De Inspectie blijft verschillen tussen schoolexamen en centraal schriftelijk examen wel monitoren om erop toe zien dat het schoolexamen en centraal examen op een school niet langdurig uiteenlopen.43

Middelbaar beroepsonderwijs

In het middelbaar beroepsonderwijs is de ontwikkeling van gedetailleerde kwalificatie-eisen samengegaan met het afzonderlijk toetsen van deze eisen. Dit heeft geresulteerd in een toename van het aantal toetsen met een beslissende functie. Tegelijk zijn de kwaliteitseisen voor toetsing aangescherpt naar aanleiding van langdurige zorgen over de toetskwaliteit in een voornamelijk decentraal georganiseerde toets- en examenpraktijk.44 Inmiddels worden kwalificatie-eisen vaker op geïntegreerde wijze getoetst en wordt de examinering steeds vaker uitbesteed aan externe organisaties.45 Wat betreft de kwaliteitseisen en de uitbesteding kenmerkt de toetspraktijk zich door tegengestelde bewegingen van centralisering en decentralisering (zie tekstkader). Een constante is echter de verdere afname van het eigenaarschap van docenten over de inhoud van toetsing (en daarmee het onderwijs).

Drie decennia geleden is het middelbaar beroepsonderwijs begonnen om, op basis van beroepsprofielen, de competenties waaraan studenten moeten voldoen op gedetailleerde wijze systematisch te beschrijven.46 De elementen van deze kwalificatiedossiers (kerntaken, werkprocessen, kennis en vakvaardigheden) werden aanvankelijk vaak afzonderlijk getoetst, maar inmiddels worden competenties vaker geïntegreerd getoetst, bijvoorbeeld aan de hand van proeven van bekwaamheid en portfolio’s.

Om de objectiviteit en betrouwbaarheid van examenbeslissingen te vergroten, is de afgelopen jaren het kwaliteitsbeleid rondom de toetsing aangescherpt. Hoewel het huidige landelijke toezichtkader geen specifieke toetsmethoden voorschrijft en (buiten de centrale examens) de instelling de ruimte laat om zelf de toetsing vorm te geven, ziet de Inspectie erop toe dat de instelling voldoende maatregelen neemt om de toetskwaliteit te borgen. De examencommissies die hier binnen de instelling verantwoordelijk voor zijn, kunnen in principe een risico-inschatting maken van wanneer extra borgende maatregelen nodig zijn. Hoewel dit steeds vaker gebeurt, nemen nog steeds veel van hen het zekere voor het onzekere. Ze schakelen voor de toetsing van praktische vaardigheden in het leerbedrijf bijvoorbeeld standaard verschillende beoordelaars in terwijl de Inspectie aangeeft dat de inzet van verschillende beoordelaars ook steekproefsgewijs kan, zeker wanneer sprake is van meerdere meetmomenten.47

Mbo-opleidingen besteden steeds vaker de vormgeving van toetsen uit aan gespecialiseerde toetsaanbieders. Deze ontwikkeling hangt samen met het aangescherpte kwaliteitsbeleid, dat nog meer dan voorheen vereist dat de gehanteerde toetsen bewezen betrouwbaar en valide zijn. De toetsen die instellingen afnemen van gecertificeerde toetsaanbieders, voldoen formeel aan die criteria.48 De uitbesteding van toetsen zorgt objectief gezien voor een verlichting van de toetsdruk, omdat docenten niet langer zelf hun toetsen ontwikkelen. Docenten ervaren echter vooral een vermindering van eigenaarschap van hun onderwijs, terwijl ze nog wel belast worden met de afname en administratie van de toetsing. Dat geldt tot op zekere hoogte ook voor de landelijke examens voor Nederlands, rekenen en Engels, die de rijksoverheid in 2010 invoerde. Waar reken- en taalvaardigheden onlosmakelijk verbonden zijn met de verschillende vakken en beroepscontexten van de opleidingen, zijn docenten door de centrale examinering meer gedwongen om zich te richten op examens waar deze vaardigheden geïsoleerd en zonder context worden getoetst. Dit zorgt voor een spanning omdat voor mbo-studenten juist de toepassing van deze vaardigheden in de praktijk relevant en betekenisvol is. Het feit dat voor taal naast centrale examens ook instellingsexamens worden afgenomen, neemt deze spanning enigszins weg, maar evenals in het voortgezet onderwijs (zie vorige paragraaf) geldt dat centrale examens al snel de instellingsexamens domineren. Voor rekenen worden nu in plaats van de centrale examens instellingsexamens voorgesteld (zie Kamerbrief 8 november 2018). Met deze maatregel zou het eigenaarschap van de toetsing weer meer bij het veld komen te liggen.

Historische ontwikkelingen in de toets- en examenpraktijk van het middelbaar beroepsonderwijs

De examinering in het middelbaar beroepsonderwijs kenmerkt zich door afwisselende bewegingen van decentralisering en centralisering. Aanvankelijk vond de examinering zowel centraal door de beroepsgroep als decentraal door de instelling plaats. Dat veranderde met de invoering van WEB (Wet educatie en beroepsonderwijs) in 1996. Er ontstonden toen multisectorale roc’s (regionale opleidingencentra) die zelf verantwoordelijk werden voor de examinering. In 2010 heeft de rijksoverheid vervolgens landelijke referentieniveaus vastgesteld en op basis hiervan (evenals in het primair en voortgezet onderwijs) landelijke examens voor Nederlands en rekenen in het middelbaar beroepsonderwijs ingevoerd. In 2012 zijn daar de generieke eisen Engels voor mbo 4 aan toegevoegd, die geleid hebben tot centrale examens en instellingsexamens vanaf studiejaar 2017-2018.

Ook het kwaliteitsbeleid rondom de examinering kenmerkt zich door afwisselende bewegingen van decentralisatie en centralisatie. Tegelijkertijd met de invoering van de WEB werd landelijk sectoroverstijgend kwaliteitsbeleid ingevoerd, dat vereiste dat instellingen hun examens moesten laten certificeren. Dat gebeurde aanvankelijk door commerciële bureaus. Omdat die echter te gemakkelijk hun goedkeuring gaven, kwamen er landelijke kwaliteitseisen voor examinering. Een landelijk overheidsorgaan, het KCE (KwaliteitsCentrum Examinering), moest erop toezien dat instellingen aan deze eisen voldeden. Het voorleggen van grote hoeveelheden toetsproducten en processen aan het KCE zorgde voor een grote beheerslast bij instellingen en bij het KCE zelf. Mede om die reden is het KCE weer opgeheven en is de Inspectie gaan toezien op de examenkwaliteit. Het toezicht van de Inspectie verschilt van het toezicht van het voormalig KCE. Het richt zich vooral op de kwaliteitsbewaking door examencommissies. In 2014 meldde de Inspectie echter dat de examenkwaliteit bij veel instellingen niet op orde was.49 Hierop heeft de minister besloten om instellingen te verplichten om hun examens in te kopen bij gecertificeerde leveranciers of hun examens te laten valideren. Veel instellingen kiezen voor de eerste optie, omdat dit meer garantie zou bieden dat de Inspectie hun toetsbeleid goedkeurt.50

Hoger onderwijs

Het hoger onderwijs kent een traditie van decentrale vormgeving in relatief losstaande onderwijseenheden, ook wel vakken of modules genoemd. Hoewel opleidingen ook samenhang aanbrengen tussen deze eenheden, is in vergelijking met andere sectoren het onderwijs in zowel het hoger beroepsonderwijs als het wetenschappelijk onderwijs meer modulair opgebouwd. Het modulaire karakter is de afgelopen decennia nog versterkt met maatregelen die meer flexibele studieprogramma’s faciliteren. Hierdoor is een grotere nadruk komen te liggen op beslissende toetsen. Een andere ontwikkeling is dat er, mede als gevolg van de toegenomen studentenaantallen, meer gebruik wordt gemaakt van kwantitatieve toetsmethoden.

Door modularisering, individualisering en maatwerk in het hoger onderwijs is het voor studenten beter mogelijk geworden om zelf een onderwijsprogramma samen te stellen en ook onderdelen bij andere instellingen te volgen, in Nederland of elders in Europa (zie tekstkader). Er is hierdoor echter ook een grotere nadruk komen te liggen op beslissende toetsing. De invoering van de bachelor-masterstructuur heeft tot een verdubbeling van stages en scripties geleid. Voorheen hoefde alleen de doctoraalfase met een stage en een scriptie te worden afgerond, nu geldt dat vaak voor zowel de bachelor- als de masteropleiding. Ook voor de reguliere onderdelen die deel uitmaken van een opleiding is de zak-slaagbeslissing steeds belangrijker geworden, omdat geborgd moet zijn dat de studenten, die steeds vaker uiteenlopende programma’s volgen, de gestelde leerdoelen binnen een module hebben behaald.

In reguliere vakken, die doorgaans een omvang hebben van vijf à tien weken, worden minimaal één en vaak meer beslissende toetsen afgenomen, omdat zowel theoretische als toepassingsgerichte elementen van een vak aan bod moeten komen. Daarnaast vindt soms ook nog formatieve toetsing plaats, om studenten voor te bereiden op een beslissende toets. Door de vele toetsen ervaren sommige studenten hun studie als een hordeloop en dit brengt soms stress met zich mee.51

Ook docenten spreken over toetsdruk, omdat zij de toetsen zelf ontwerpen en beoordelen, aangezien ze op die manier specialistische en actuele kennis kunnen adresseren. Daarbij dienen ze rekening te houden met de aan toetsing gestelde kwaliteitseisen. De afgelopen jaren zijn deze eisen aangescherpt, mede door het kwaliteitsbeleid dat instellingen voeren. Aanleiding voor de aanscherping waren incidenten waarbij aan het licht kwam dat de kwaliteit van de eindwerken niet goed was geborgd.52 Daarnaast houden docenten ook rekening met de studenten zelf, die direct of via studentevaluaties, opleidingscommissies of de examencommissie hun mening kunnen geven over de inhoud en kwaliteit van toetsing. Deze verschillende partijen dringen er bij docenten op aan dat zij hun beoordelingen op transparante wijze verantwoorden. Mede hierdoor kiezen docenten sneller voor kwantitatieve toetsmethoden. Een andere reden hiervoor is dat deze methoden efficiënter zijn; dit is van belang gezien de gestegen aantallen studenten in het hoger onderwijs.

Modularisering van opleidingen zet de samenhang van opleidingen onder druk. Tot op zekere hoogte zorgen afsluitende onderdelen als eindwerkstukken, stages en scripties voor samenhang in het toetsprogramma. Deze onderdelen toetsen geïntegreerd de eindtermen. Verantwoordelijke docenten en examencommissies worstelen echter met het toewerken naar deze afsluitende onderdelen. Dit komt doordat de modulaire opzet van een programma en een gevarieerde studentenpopulatie als gevolg van de zijinstroom een goede opbouw van leerdoelen en toetsing soms in de weg staan. Verder geldt dat de afsluitende onderdelen weliswaar veel, maar zeker niet alle eindtermen van de opleiding adresseren. Het blijft daardoor de vraag of studenten door het accent op kwantitatieve toetsing de vaardigheden en kennis, die in eerdere vakken zijn ‘afgetoetst’, voldoende hebben geconsolideerd. Bovendien heeft ook hier de kwantitatieve manier van toetsing een versmalling van de curriculuminhoud tot gevolg.

Historische ontwikkelingen in de toets- en examenpraktijk van het hoger onderwijs

In het hoger onderwijs heeft de toetsing belangrijke functies voor het bevorderen en diplomeren van studenten. In de modulaire opbouw die kenmerkend is voor zowel het hoger beroepsonderwijs als het wetenschappelijk onderwijs, worden vakken afgesloten met tentamens. Wanneer studenten een tentamen halen, krijgen ze studiepunten, waarmee zij uiteindelijk een diploma behalen. De afgelopen decennia is in Europees verband gewerkt aan het vergroten van de flexibiliteit van studieprogramma’s en het vereenvoudigen van de uitwisseling van studenten. Hiertoe is de bachelor-masterstructuur ingevoerd en hebben studiepunten een vaste omvang gekregen (volgens het European Credit Transfer System). Instellingen zelf zijn daarnaast ook overgegaan tot vaste blokindelingen.53 De meeste opleidingen hanteren een jaar- of semesterindeling van blokken met bijvoorbeeld zes keer twee parallelle blokken van vijf studiepunten, waarbij doorgaans in de laatste week een of meer afsluitende toetsen worden afgenomen.54 Van de blokstructuur kan worden afgeweken; aan studieonderdelen als stage of scriptie, die een plaats hebben aan het eind van de opleiding, worden grotere blokken (meer studiepunten) toegekend. Soms worden aan onderdelen van de scriptie, zoals het schrijven van een plan, deelbeoordelingen toegekend.

Toetsing speelt in het hoger onderwijs eveneens een belangrijke rol in de beoordeling van de kwaliteit van het onderwijs. Hoewel er geen door de overheid gecoördineerde examens worden afgenomen, borgt de overheid wel de kwaliteit van de toetsing en examinering via de Inspectie en de NVAO (Nederlands-Vlaamse Accreditatieorganisatie). De NVAO verleent accreditatie aan een opleiding op basis van een visitatie. Zusteropleidingen zitten in een cluster en worden in dezelfde periode gevisiteerd.55 Toetsing en examinering spelen een belangrijke rol bij deze visitaties. Nagegaan wordt of de opleiding beschikt over een adequaat systeem van toetsing (standaard 3) en of de gerealiseerde onderwijsopbrengsten die aan de hand van dit systeem worden aangetoond voldoen (standaard 4). Standaard 3 wordt voornamelijk beoordeeld op basis van de kwaliteitszorg rondom examens van de opleiding, in het bijzonder het functioneren van de examencommissie. Standaard 4 wordt steekproefsgewijs beoordeeld aan de hand van afsluitende toetsen, waaronder eindwerkstukken, scripties en portfolio’s en soms ook toetsen in eerdere fasen van de opleiding.56

Om de kwaliteit van de toetsing beter te borgen, hebben examencommissies in het hoger onderwijs met de invoering van de Wet versterking besturing in 2010 een grotere rol gekregen. De wet regelt dat examencommissies meer dan voorheen verantwoordelijkheden en bevoegdheden hebben ten aanzien van het borgen van de kwaliteit van de toetsing en gerealiseerde opbrengsten van afgestudeerden. Naast deze maatregelen zijn er ook andere maatregelen genomen.57 Het gaat dan bijvoorbeeld om een andere rol van opleidingscommissies, externe validering van examens, scholing en certificering van docenten op het gebied van toetsing, en in enkele gevallen ook instellingsoverstijgende toetsing.58

3. Overheid en instellingen: baseer de toetspraktijk op een heldere visie

Een evenwichtige toetspraktijk vraagt zowel van de rijksoverheid als van onderwijsinstellingen een heldere visie op toetsing en examinering. Vanuit deze visie en daaruit voortvloeiende verantwoordelijkheden kunnen zowel overheid als instellingen duidelijke kaders bieden, zodat alle betrokkenen in het veld de bestaande ruimte voor toetsing en examinering beter kunnen benutten.

Toewerken naar een evenwichtiger toetspraktijk vraagt om een heldere visie. Zowel de rijksoverheid als onderwijsinstellingen dienen een dergelijke visie te formuleren als vertrekpunt voor het vormgeven van het toetsbeleid. De raad adviseert de rijksoverheid om een consistent toetsbeleid te voeren en duidelijke kaders te stellen. De instellingen beveelt hij aan om binnen de gegeven kaders een eigen visie op toetsing te formuleren en daarmee de ruimte te benutten die beschikbaar is. In beide gevallen is rolvastheid voor alle betrokken partijen noodzakelijk. Rolverwarring draagt niet bij aan de kwaliteit van de toets- en examenpraktijk.

Een visie formuleren betekent stellingname. Overheid en instellingen dienen zich in de ogen van de raad, vanuit hun verschillende rollen, uit te spreken over:

  1. de mate waarin toetsing beslissende en formatieve functies heeft;
  2. de mate waarin de besluitvorming rond toetsing centraal of decentraal plaatsvindt; en
  3. de mate waarin onderwijsopbrengsten op kwantitatieve wijze of meer kwalitatieve wijze zichtbaar worden gemaakt.

Zoals aangegeven in hoofdstuk 2 dienen overheid en instellingen te zoeken naar een balans binnen deze dimensies, waarbij uiteenlopende doelen met elkaar worden verenigd en toetsing ten dienste staat van de onderwijskwaliteit, de leerloopbaan van de leerling en student en de te verwerven positie op de arbeidsmarkt en in de maatschappij.

3.1 Overheid: bied duidelijke kaders aan de onderwijsinstellingen

Op welke onderdelen legt de rijksoverheid de toetsing vast? Hoeveel ruimte geeft zij aan de instellingen? Dat verschilt per sector, maar alle onderwijsinstellingen hebben belang bij duidelijke kaders die de beschikbare ruimte afbakenen. Deze kaders worden om te beginnen gevormd door rolvastheid en consistentie in het landelijke toetsbeleid. Voor een evenwichtige toetspraktijk wijst de raad daarnaast op de voordelen van standaardisering van de eindtoetsing, die – in bepaalde mate – voor alle sectoren kan worden overwogen. De kwaliteitszorg rondom de toets- en examenpraktijk in de onderwijsinstelling wordt in de ogen van de raad versterkt door toets- en examencommissies te verplichten voor primair en voortgezet onderwijs. Ook het toezicht op de toetspraktijk in de verschillende sectoren vraagt volgens de raad om aanscherping.

Bewaak de consistentie in het toetsbeleid en wees rolvast

De raad acht het van groot belang dat de rijksoverheid standvastig is in haar toetsbeleid en dat zij niet buiten haar rol treedt. Standvastig beleid biedt onderwijsinstellingen duidelijkheid bij het vormgeven van hun eigen visie op toetsing. Het onderwijsveld moet erop kunnen vertrouwen dat de standpunten van de rijksoverheid ten aanzien van toetsing niet telkens wijzigen. Soms worden in rap tempo maatregelen ingevoerd, die achteraf onvoldoende doordacht blijken te zijn. Dan worden maatregelen weer teruggedraaid. Of de rijksoverheid begeeft zich op het terrein van de onderwijsinstelling met bepaalde maatregelen en is daarmee niet rolvast. Dit schept verwarring waar juist behoefte is aan helderheid.

Een voorbeeld van zo’n maatregel is het in de tijd naar achteren verschuiven van het afnamemoment van de eindtoets (zie pagina @). Deze maatregel is meteen breed ingevoerd op alle basisscholen, zonder dat vooraf goed in kaart was gebracht wat invoering zou betekenen voor leerlingen, ouders en scholen, en welke consequenties dit zou hebben voor toegankelijkheid en gelijke kansen. Door de eindtoets minder gewicht toe te kennen, lijkt het advies dat leerlingen krijgen afhankelijker te worden van hun achtergrond.59 Dit doet afbreuk aan het principe van gelijke kansen voor iedereen. Inmiddels gaan weer stemmen op voor het terugdraaien van de maatregel.60

Het komt vaker voor dat besluiten met betrekking tot toetsing snel weer worden teruggedraaid. Zo werd een streep gezet door de wettelijke plicht van de diagnostische tussentijdse toets in het voorgezet onderwijs.61 Begin 2018 deelde de minister nog mee dat de rekentoets toch niet meetelt voor het vwo-eindexamen62 en inmiddels ligt er een voorstel om rekenen weer wel mee te laten tellen, maar dan via het schoolexamen63 (zie onderstaand kader). En recent werd het voornemen gedeeld om het aantal studiepunten dat behaald moet worden voor het bindend studieadvies in het hoger onderwijs te verlagen.64

De rekentoets in het voortgezet onderwijs

De rekenprestaties van alle leerlingen verbeteren was een van de doelen bij het invoeren van de referentieniveaus.65 De Tweede Kamer besloot destijds om aan het eind van een opleiding te toetsen of leerlingen het vastgestelde referentieniveau hebben gehaald. Aan het eind van het voortgezet onderwijs werd een rekentoets als verplicht onderdeel van het examen ingevoerd voor alle leerlingen van alle schoolsoorten. De rekentoetsen in het voortgezet onderwijs werden sinds het schooljaar 2013-2014 verplicht, maar telden op dat moment nog niet mee in de zak-slaagbeslissing. Wel werd het cijfer voor de rekentoets vermeld op (een bijlage bij) de cijferlijst.

De rekentoets is in enkele opzichten een novum in het voortgezet onderwijs. Exact dezelfde toets en cesuur gelden voor meerdere opleidingen (2F voor vmbo en 3F voor havo en vwo) en hoewel de leerinhoud wordt afgesloten met een centrale toets, betreft het geen zelfstandig vak. Bovendien worden de rekentoetsen geheel digitaal afgenomen en automatisch gescoord en genormeerd aan de hand van een vaardigheidsschaal.66

De invoering van de rekentoets voortgezet onderwijs was van meet af aan onderwerp van discussie. Meningsverschillen waren er onder meer over de methode, over de te toetsen leerinhoud (wel/geen rekenmachine, kale sommen of contextopgaven), over de positie in de zak-slaagregeling, over de voorbereiding door scholen, over de toets zelf (het aantal opgaven, het digitale karakter) en over de snelheid van invoering. Ook vielen de resultaten op de rekentoetsen tegen en bleek 2F niet voor alle leerlingen haalbaar. Dit resulteerde in verschillende debatten, algemene overleggen en rondetafelgesprekken in de Tweede Kamer, het instellen van een tweetal adviescommissies67, en het uitvoeren van een aantal onderzoeken en intensiveringstrajecten.68 Als antwoord hierop zijn de toetsen en examens op verschillende punten aangepast en zijn er varianten gekomen voor specifieke doelgroepen.

Het laten mee tellen van het cijfer op de rekentoets vo was voorzien vanaf schooljaar 2015-2016, maar is verschillende keren uitgesteld. Uiteindelijk heeft de rekentoets vo alleen voor het vwo één jaar meegeteld voor het diploma. In het regeerakkoord van het kabinet-Rutte III is aangekondigd dat er een alternatief voor de rekentoets komt. Dit alternatief treedt uiterlijk in het schooljaar 2019-2020 in werking en wordt daarmee voor alle leerlingen op alle niveaus een geïntegreerd onderdeel van het examen. Inmiddels ligt er een plan om rekenen mee te laten tellen voor het behalen van een diploma in het vmbo, havo, vwo en mbo, via het school- of instellingsexamen.69

Ook gebeurt het dat de rijksoverheid, naar aanleiding van een maatschappelijk of politiek debat over toetsing en examinering, regels vastlegt die de ruimte voor de school en de leraar onnodig inperken. Een voorbeeld daarvan is het recente verbod op het gebruik van kleutertoetsen in het leerlingvolgsysteem.70 De regering kiest hiermee positie in een langlopende discussie over voor- en nadelen van toetsen voor jonge kinderen.71 De raad vindt dat het niet aan de rijksoverheid is om voor scholen te bepalen of zij wel of niet gebruikmaken van kleutertoetsen. Er zijn leraren die het toetsen van kleuters onverstandig vinden en liever een observatie-instrument gebruiken. Maar er zijn ook leraren die juist vinden dat het toetsen van kleuters zicht biedt op de ontwikkeling en handvatten geeft voor hun onderwijspraktijk.

Standaardiseer eindtoetsing waar nodig en mogelijk

De raad wijst op de voordelen van gestandaardiseerde eindtoetsing bij belangrijke overgangen in het stelsel. Niet alleen bij de overgang van het primair naar het voortgezet onderwijs en van het voortgezet onderwijs naar een vervolgopleiding, maar ook bij andere overgangen zijn er voordelen van standaardisering van de eindtoetsing. Gestandaardiseerde eindtoetsing biedt een duidelijk kader voor alle betrokkenen. Vanuit dat kader ontstaat er ruimte voor instellingen om hun eigen onderwijsdoelen en de toetsing daarvan vorm te geven. Voor het funderend onderwijs en voor het middelbaar beroepsonderwijs (de centrale examens) geldt bovendien dat gestandaardiseerde eindtoetsing garandeert dat de ijkpunten bewaakt worden. Daarmee ontstaat vrijheid voor het vormgeven en uitvoeren van de eigen visie op onderwijs en toetsing van de instelling.

In het primair onderwijs maken alle leerlingen een eindtoets. Doordat er tegenwoordig meerdere aanbieders zijn in de markt van eindtoetsen, hebben basisscholen meer keuzevrijheid dan voorheen.72 Deze keuzevrijheid heeft een prijs. Het is lastig de verschillende eindtoetsen zo te normeren dat ze onderling vergelijkbaar zijn.73 De Inspectie waarschuwde in 2017 voor de afnemende vergelijkbaarheid van de eindtoets als gevolg van de toelating van nog drie nieuwe versies op de markt.74 In 2018 bleek dat zwakkere scholen gebruikmaken van andere eindtoetsen dan betere scholen.75 Hiermee staat een van de ijkpunten in het Nederlandse onderwijsstelsel onder druk. Eén eindtoets zou dit ondervangen, maar doet geen recht aan de verschillende visies en voorkeuren met betrekking tot toetsing onder basisscholen. Het belang van de eindtoets als ijkpunt voor het onderwijsstelsel is dusdanig groot, dat de raad vindt dat de toetsen van onbetwistbare kwaliteit moeten zijn. Dat houdt in dat verschillen in de normering van de verschillende eindtoetsen niet acceptabel zijn en dat alles op alles gezet moet worden om deze toetsen door de overheid (College voor Toetsen en Examens) te kalibreren en stelselmatig te evalueren.[73: Voor 2019 kunnen scholen kiezen uit de volgende toetsen: centrale eindtoets po van het College voor Toetsen en Examens; eindtoets ROUTE 8 van A-VISION; IEP-eindtoets van Bureau ICE; DIA-eindtoets van Diataal; AMN-eindtoets van AMN.][74: Glas, Emons, & Berding-Oldersma, 2016.][75: Inspectie van het Onderwijs, 2017.][76: Inspectie van het Onderwijs, 2018a.]

De raad heeft diverse malen het belang van gestandaardiseerde eindtoetsen als ijkpunten in het voortgezet onderwijs onderstreept.76 Om daadwerkelijk als ijkpunten te kunnen fungeren dienen centrale examens van hoge kwaliteit te zijn en dienen alle betrokkenen, waaronder leerlingen, ouders, scholen en vervolgopleidingen, hiervan overtuigd te zijn. Uit onderzoek blijkt dat de centrale schriftelijke eindexamens in ons land van goede kwaliteit zijn en dat ze een bijdrage leveren aan goed onderwijs.77 Dat neemt niet weg dat het volgens de raad belangrijk is om scherp te blijven en om incidenten met betrekking tot de inhoud en afname van de centrale schriftelijke eindexamens te voorkomen. Waar zich incidenten voordoen is het van belang er open over te zijn, ervan te leren en ze in perspectief te plaatsen. Voorkomen moet worden dat het vertrouwen in het gehele centrale examen ondermijnd wordt door specifieke incidenten in een bepaalde context.

Om de kwaliteit en het vertrouwen te borgen zijn zorgvuldige en transparante procedures nodig, waarbij er voldoende deskundigheid en ‘checks and balances’ zijn. De raad constateert met tevredenheid dat de procedures van het College voor Toetsen en Examens op dit punt zijn verbeterd. Zo hebben leraren en vakverenigingen meer mogelijkheden gekregen om mee te denken over de correctievoorschriften.78 De raad moedigt het College voor Toetsen en Examens aan zijn nieuwe beleid voort te zetten en verder aan te scherpen. Aan het bredere onderwijsveld doet de raad enerzijds de aanbeveling om gebruik te maken van de mogelijkheden om mee te denken over het centrale examen en anderzijds om realistische verwachtingen te koesteren. Het centrale examen is op zijn best de grootste gemene deler van hoe in het voorgezet onderwijs de eindtoetsing wordt gewenst. Het kan dus per definitie niet tegemoetkomen aan alle persoonlijke wensen en kritiek. Tegelijkertijd is het centraal examen een noodzakelijke tegenhanger van de vrijheid van onderwijs die ons stelsel kenmerkt. De raad wil er ten slotte op wijzen dat een deel van die vrijheid in het voortgezet onderwijs ook ligt bij het schoolexamen en dat die vrijheid beter benut en ingevuld zou kunnen worden dan nu het geval is.

Voor het middelbaar beroepsonderwijs adviseert de raad om pas op de plaats te maken met verdergaande wijzigingen in toetsing. De sector is in de afgelopen jaren blootgesteld aan vele wijzigingen in toetsing en heeft tijd nodig om deze wijzigingen te kunnen borgen. Met betrekking tot standaardisering van de eindtoetsing vindt de raad de huidige aanzet voor sectorale examenprofielen voor vergelijkbare kwalificatiedossiers een vorm van standaardisering die het civiel effect van mbo-diploma’s ten goede komt. Van belang is wel dat de beroepssectoren deze examenprofielen nog concreter invulling geven, zodat ze daadwerkelijk handvatten voor examinering bieden en in de onderwijspraktijk ‘gaan leven’. De raad is minder gelukkig met de deelcertificering die nu voor sommige examenonderdelen mogelijk is (het gaat daarbij om onderdelen waarvan is aangetoond dat ze afzonderlijke betekenis hebben voor de arbeidsmarkt). Deze certificering is weliswaar begrijpelijk in het licht van gepersonaliseerd onderwijs, maar leidt tot versnippering van kwalificatie-eisen en doet daarmee afbreuk aan het civiel effect van diploma’s.79 Daarnaast ontneemt de losse certificering studenten een langetermijnperspectief op hun opleiding, waarbij ze toewerken naar complete beheersing van de eindtermen aan het eind van de opleiding.

De raad plaatst ook vraagtekens bij het op voorhand valide verklaren van examenonderdelen van examenleveranciers die over een keurmerk beschikken. De raad constateert dat op dit punt de examencommissie, die formeel opdrachtgever is aan de toetsaanbieders, al te snel wordt gepasseerd. De examencommissie moet immers een oordeel vellen over de validiteit van de examens en zo nodig aanpassingen in de examinering kunnen afdwingen wanneer daarmee een betere aansluiting ontstaat bij eigen toetsvisie en de plaats van de examens in de opleiding. Op die manier behoudt de opleiding het eigenaarschap over een belangrijk deel van het onderwijs. Daarnaast zou uitbesteding niet de voorkeursoptie moeten zijn (de richtlijn dat uitbesteding de voorkeur heeft, wordt thans afgegeven door de MBO Raad en de Nederlandse Raad voor Training en Opleiding). Opleidingen die de examinering zelf of samen met de externe toetsaanbieders vorm wensen te geven, moeten worden aangemoedigd. Aanmoediging betekent ook dat de hiervoor benodigde deskundigheid bij docenten wordt vergroot (zie hoofdstuk 4).

In het hoger onderwijs vindt de eindtoetsing voornamelijk decentraal plaats. De opleiding bepaalt binnen de kaders van de Dublin-descriptoren wat de algemene eisen zijn voor succesvolle afronding van een bachelor- of masteropleiding.80 De docenten die het desbetreffende vak verzorgen, zorgen doorgaans voor de vormgeving van de examenonderdelen. Deze decentrale regie op de eindtoetsing heeft als voordeel dat de toetsing eerder aansluit bij de visie van de opleiding en de docenten. Een nadeel kan echter zijn dat de eisen aan studenten van dezelfde opleiding bij verschillende universiteiten uiteen gaan lopen. Opleidingen maken weliswaar afspraken om beroepsprofielen of kwalificatie-eisen af te stemmen (dit gebeurt bijvoorbeeld in het kader van visitaties of akkoorden met de beroepssector in het hoger beroepsonderwijs), maar deze standaarden hebben een algemeen karakter. Opleidingen en docenten geven verschillende interpretaties aan deze standaarden waar het gaat om examinering. Het resultaat is dat er verschillen ontstaan tussen opleidingen in de feitelijke eisen die aan de student worden gesteld.

Omdat de raad hecht aan een duidelijk eigen profiel van hogeronderwijsopleidingen, juicht hij accentverschillen in profilering tussen zusteropleidingen toe.81 Wanneer er echter grote niveauverschillen tussen zusteropleidingen ontstaan, ziet hij wel een probleem. Een diploma van dezelfde studie aan verschillende universiteiten of hogescholen heeft dan op papier wel, maar in de praktijk niet dezelfde waarde en dat betekent dat het civiel effect van het diploma onder druk komt te staan.82 De raad constateert bovendien dat het risico op dergelijke niveauverschillen groter is geworden doordat het al moeilijk is om binnen een opleiding het niveau te borgen, als gevolg van modularisering, de stijgende diversiteit van studentenpopulaties en de flexibilisering van onderwijsprogramma’s. Dergelijke ontwikkelingen maken het noodzakelijk om na te denken over meer centralisering van toetsing. De raad denkt hierbij niet aan door de landelijke overheid gecoördineerde toetsing, omdat dat niet past bij de aard van de sector en bij de academische vrijheid.83 Hij denkt aan verdergaande samenwerking tussen zusteropleidingen. Behalve de gezamenlijke formulering van kwalificatie-eisen is het ook zinvol om na te gaan of zusteropleidingen, net zoals in het middelbaar beroepsonderwijs, per sector of discipline gezamenlijke examenprofielen kunnen maken of, zoals bij de universitaire medische opleidingen, op onderdelen hun toetsing gezamenlijk kunnen vormgeven. Ook is zo’n ontwikkeling aan te bevelen om internationale mobiliteit te bevorderen.84

Geef ook het toezicht op toetsing en examinering vorm als duidelijk kader voor het veld

Naast consistent beleid en, waar nodig, standaardisering van de eindtoetsing, vormt het toezicht een duidelijk kader voor onderwijsinstellingen met betrekking tot toetsing en examinering. Onderwijsinstellingen weten vanuit de toezichtkaders waar ze aan moeten voldoen en waar ze hun eigen ruimte kunnen gebruiken. De raad is van mening dat de positie van toetsing in het toezicht verbeterd kan worden. Hij licht dit hieronder per sector toe.

Voor het primair onderwijs kan het toezicht op de toetsing buiten de eindtoets om zich beperken tot de deugdelijkheid van toetsprocessen. Scholen moeten inzichtelijk kunnen maken hoe zij hun kwaliteitszorg rondom toetsing hebben ingericht, met aandacht voor bijvoorbeeld de deskundigheid van betrokkenen, de mate waarin de gekozen instrumenten de onderwijsdoelen dienen, en de samenhang tussen toetsen. Het vernieuwde toezicht is al meer dan voorheen gericht op processen, maar heeft volgens de raad nog onvoldoende aandacht voor toetsing als apart onderwerp. Het ontwerp van het nieuwe onderwijsresultatenmodel bevat voorstellen voor breder kijken naar resultaten.85 De raad is hier voorstander van, maar vindt nadrukkelijk dat gewaakt moet worden voor het aanvullen van verantwoordingskaders met een set met ‘af te vinken’ aspecten van brede onderwijskwaliteit. Dit brengt namelijk het risico met zich mee dat scholen zich hierdoor laten sturen, met als gevolg dat zij de aandacht gaan richten op zaken die daarvoor in kaart moeten worden gebracht in plaats van de eigen visie te ontwikkelen en in de praktijk te brengen. De raad heeft in zijn advies De volle breedte van onderwijskwaliteit suggesties gedaan voor hoe dit wel vorm zou kunnen krijgen.86 Het valt volgens de raad te overwegen om het schooleigen gedeelte van de toetsing meer gewicht te geven. Dit kan dan ook een duidelijkere rol spelen in de advisering voor het vervolgonderwijs en zou dan tevens aandacht moeten krijgen in het toezicht. De raad is daarmee nog geen voorstander van een eindexamen primair onderwijs. Het gaat hem om het verder vergroten van de aandacht voor wat scholen doen buiten de onderdelen die getoetst worden in de eindtoets.

De Inspectie gebruikt eindtoetscijfers in het primair onderwijs ook in het toezicht op de kwaliteit van de school. Voor toeleiding naar het vervolgonderwijs zijn de vaardigheden die in de eindtoets aan bod komen redelijk goede voorspellers van succes87, maar als peilstok voor de Nederlandse onderwijskwaliteit vormen ze een te smalle basis. Instrumenten zoals de peilingsonderzoeken88 bieden een bredere kijk op de onderwijskwaliteit dan taal- en rekenvaardigheden in de eindtoets. Eindtoetscijfers zijn niet een op een te relateren aan de kwaliteit van een school, ook niet na controle voor achtergrondkenmerken of een toets in groep 3.89 Scholen die soepeler zijn in het accepteren van nieuwkomers of scholen die minder snel verwijzen naar het speciaal onderwijs, zullen minder goed scoren dan verwacht. Scholen die daarentegen veel voor de eindtoets oefenen, zullen beter scoren. De raad heeft dan ook eerder aangegeven dat scholen niet generiek dienen te worden ‘afgerekend’ op eindtoetsresultaten.90 De Inspectie baseert zich in het toezicht tegenwoordig op een veel breder palet aan indicatoren dan eindtoetsen alleen. De raad vindt dat een belangrijk gegeven. Zodra scholen namelijk worden afgerekend op hun (gemiddelde) toetsprestaties, kunnen perverse prikkels ontstaan die de kwaliteit van het onderwijs onder druk zetten.

Voor het voortgezet onderwijs acht de raad het wenselijk dat er in de praktijk duidelijker onderscheid wordt aangebracht tussen het schoolexamen en het centraal schriftelijk examen. Het schoolexamen zou een zelfstandig onderdeel van de toetspraktijk in het voortgezet onderwijs moeten blijven, waarin scholen de gelegenheid krijgen om brede onderwijskwaliteit en eigen specialisering in kaart te brengen. Het schoolexamen is niet bedoeld als oefenexamen voor het centraal schriftelijk examen, maar wordt hier wel regelmatig voor ingezet. De raad heeft tijdens veldraadplegingen diverse interessante mogelijkheden gehoord voor het vergroten van de zelfstandige rol van het schoolexamen. Het kan gaan om het omdraaien van het schoolexamen en het centraal schriftelijk eindexamen, om een portfoliomodel waarbij het schoolexamen een soort meesterproef of een serie meesterproeven wordt, of om het beperken van het centraal schriftelijk examen tot de kernvakken. De raad is er voorstander van deze alternatieven te onderzoeken en te evalueren.

Bij een zelfstandige rol van het schoolexamen wordt het des te belangrijker om de kwaliteit hiervan goed te borgen en hier goed op toe te zien. De perikelen op het vmbo Maastricht tijdens de afgelopen examenperiode hebben geleid tot een hernieuwde discussie over het belang van toezicht op het schoolexamen.91 De raad vindt dit begrijpelijk, omdat de consequenties van de Maastrichtse zaak zeer ingrijpend zijn geweest voor de betrokken leerlingen. Toch zou de raad de rijksoverheid willen oproepen om de zogenoemde risico-regelreflex te vermijden.92 Aan scholen komt ruimte toe om het schooldeel van het examen zelf in te vullen, uiteraard binnen de kaders van de eindtermen en met goede borging van de kwaliteit en goed toezicht.

Bij het middelbaar beroepsonderwijs kan het toezicht op de instellingsexamens volgens de raad generieker plaatsvinden, zoals ook al in het meest recente onderzoekskader mbo van de Inspectie wordt voorgestaan.93 Door examinering van een opleiding als geheel te bekijken, kan de examendruk omlaag en kan worden toegewerkt naar een kleinere en beter behapbare set toetsen. Voorheen richtte de verantwoording op de dekking van het kwalificatiedossier zich te veel op details, waarbij instellingen zich weinig vrijheden en ruimte voor eigen invulling permitteerden. Opleidingen waren vooral gericht op volledige dekking van het kwalificatiedossier, maar gaven aan dat het ondoenlijk was om aan alle gestelde eisen te voldoen bij de afnames en beoordelingen van examens in de praktijk. In het meest recente onderzoekskader van de Inspectie zijn de eisen niet meer zo specifiek geformuleerd, maar instellingen vinden het lastig om de vrijheid die er nu wel is, te benutten.

De raad signaleert wel behoefte aan duidelijke richtlijnen voor toetsing in de praktijk, omdat er nu vaak geen aandacht is voor de plaats van een onderdeel in het totaal en er te weinig wordt gedaan om dubbel toetsen te voorkomen. Uiteraard is het niet de bedoeling dat de sector terugkeert naar de situatie waarvoor het fijnmaziger toezicht toentertijd in het leven werd geroepen (zie pagina 23). De raad ziet de toenmalige wijziging ook als een uiting van de hierboven genoemde risico-regelreflex. Hij ziet de oplossing in meer deskundigheid en betrokkenheid (zie ook hoofdstuk 4) en niet in het voortdurend aanscherpen van de regelgeving.

Waar het gaat om de examencommissies in het middelbaar beroepsonderwijs is het volgens de raad verstandig de komende jaren vooral goed de vinger aan de pols te houden, conform de huidige vormgeving van het toezicht.94 De taken en bevoegdheden van de examencommissies zijn in augustus 2017 aangescherpt. De commissies hebben nieuwe taken toegewezen gekregen en ook de verantwoordelijkheden van het bevoegd gezag ten aanzien van de examencommissies zijn veranderd. De kwaliteitsborging van deze commissies heeft in het onderzoekskader van de Inspectie een prominentere plaats gekregen. Zolang de beleidsmatige invoering van de nieuwe taken nog in ontwikkeling is, voert de Inspectie vaker volledig onderzoek uit naar de examencommissies. De raad ziet echter een degelijke regelmatige evaluatie als noodzakelijke onderdeel van de kwaliteitscyclus.

De visitaties in het kader van de NVAO in het hoger onderwijs richten zich volgens de raad formeel op papier in voldoende mate op de kwaliteit van de toetsing en examinering. Een adequaat systeem van toetsing en examinering is een van de vier standaarden aan de hand waarvan accreditatie wordt verleend en dit komt indirect ook aan bod bij de standaard van het aantonen van gerealiseerde onderwijsopbrengsten. Dit laatste gebeurt voornamelijk door middel van examinering. Het is vooral zaak om deze standaarden daadwerkelijk goed te evalueren. Dat betekent bijvoorbeeld dat het toezicht niet beperkt blijft tot het bekijken van een aantal eindwerken, maar dat ook de opbouw van het gehele toetsprogramma en de kwaliteit van de toetsen in beschouwing wordt genomen. Het betekent ook dat belangrijke competenties, zoals het uitvoeren van een onderzoek, niet eenmalig maar herhaaldelijk worden getoetst, waarbij de opdrachten steeds complexer worden. Het toezien op dergelijke kwaliteiten vergt toetsdeskundigheid. De raad beveelt aan om de toetsdeskundigheid van visitatiepanels verder te vergroten door scholing of het aantrekken van deskundige externen.95 In het hoger beroepsonderwijs is het noodzakelijk dat toekomstige werkgevers niet alleen in voldoende mate betrokken zijn, maar ook inhoudelijk gekwalificeerd zijn om deel te nemen aan de eindbeoordeling. Daartoe is afstemming tussen de eisen en verantwoordelijkheden van toekomstige werkgevers en de beroepsopleidingen zelf van cruciaal belang.

Borg kwaliteit door verplichten toets- of examencommissies in het primair en voortgezet onderwijs

De raad adviseert de rijksoverheid om voor het primair en het voortgezet onderwijs een uit leraren/docenten bestaande toets- of examencommissie bij wet te verplichten. In het voortgezet onderwijs gaat het dan om een toets- en examencommissie, in het primair onderwijs om een toetscommissie, aangezien deze sector geen examens kent. Binnen de dimensie centraal-decentraal leidt een dergelijke commissie, mits goed ingericht, tot het verbeteren van de kwaliteit van de toetsing en examinering op het decentrale niveau. Dergelijke commissies verbeteren de kwaliteitsborging van toetsing en examinering. Daarnaast dragen ze bij aan het vergroten van het eigenaarschap van toetsing en examinering bij onderwijsinstellingen en in het bijzonder bij leerkrachten/docenten. Ook neemt de deskundigheid op dit gebied zo toe. Alle betrokkenen in het onderwijs zouden, zoals de raad bepleit in hoofdstuk 4, over enige mate van toetsdeskundigheid moeten beschikken. Gezien de complexiteit van de materie acht de raad een commissie met specifieke verantwoordelijkheden en expertise op dit gebied echter wenselijk. De raad benadrukt dat hierbij teamverantwoordelijkheid met specifieke toetsdeskundigheid de voorkeur verdient om toename van werkdruk te voorkomen.

Net als in het middelbaar beroepsonderwijs en het hoger onderwijs is een toetscommissie in het primair onderwijs en een toets- en examencommissie in het voortgezet onderwijs primair belast met borging van de kwaliteit van toetsing en examens.96 Voor de precieze taken en bevoegdheden kan inspiratie ontleend worden aan de regelingen voor de examencommissies in het middelbaar beroepsonderwijs en het hoger onderwijs. Tegelijk is het zaak de wettelijke regelingen voor de genoemde commissies af te stemmen op specifieke omstandigheden in die sectoren. Bij het opstellen van de wettelijke regeling is het van belang om naast de taken en bevoegdheden van de commissie ook de samenstelling en de positionering ervan goed te regelen. Hoe verhoudt de toetscommissie of de toets- en examencommissie zich tot het bestuur, de schoolleiding, het onderwijsteam, de individuele leraar/docent en de medezeggenschapsorganen?

In het funderend onderwijs kan een toetscommissie of een toets- en examencommissie op verschillende manieren vormgegeven worden. Bij grote scholen of scholengemeenschappen kan een school een eigen commissie krijgen. Het zou echter ook mogelijk moeten zijn om te kiezen voor één commissie voor meerdere scholen onder hetzelfde bevoegd gezag. In het geval van éénpitters met kleine scholen kan gewerkt worden met extra expertise van buitenaf, als binnen de school nog onvoldoende deskundigheid beschikbaar is. De raad vindt het in alle gevallen wel wenselijk om in ieder team kennis van toetsing in ieder geval bij één iemand te beleggen, ook als er sprake zou zijn van een overkoepelende commissie. Dit versterkt het eigenaarschap van toetsing en examinering binnen de school.97

3.2 Onderwijsinstelling: neem een standpunt in op belangrijke toetsvraagstukken

Onderwijsinstellingen moeten op hun beurt duidelijke kaders bieden aan hun leraren en docenten, net zoals de rijksoverheid duidelijke kaders moet bieden aan de instellingen. De basis voor deze kaders wordt gevormd door een toetsvisie op instellingsniveau. Deze visie geeft aan hoe toetsing wordt afgestemd met onderwijsdoelen, onderwijsinhoud en onderwijsmiddelen. Voor het vormgeven van deze visie dienen instellingen keuzes te maken ten aanzien van belangrijke toetsvraagstukken. Welke ruimte krijgen leraren en docenten voor het zelf vormgeven van toetsen? Hoeveel wordt op hoger niveau belegd? Hoeveel aandacht krijgt formatieve toetsing? Welke gevolgen heeft dat voor de beslissende toetsing? Waar worden kwalitatieve toetsmethoden ingezet en waar wordt vastgehouden aan kwantitatieve toetsing? Vanuit dergelijke keuzes kunnen onderwijsinstellingen de ruimte die hun ter beschikking staat, optimaal benutten en de balans in hun eigen toets- en examenpraktijk aanbrengen.

De keuzes zullen leiden tot verschillen tussen onderwijsinstellingen. De duidelijke kaders van de rijksoverheid uit paragraaf 3.1 bieden ruimte voor deze verschillen en de raad moedigt deze verschillen aan als zij daadwerkelijk het resultaat zijn van visiegestuurde beleidskeuzes ten aanzien van toetsing. Niettemin doet de raad hieronder enkele generieke aanbevelingen. De raad adviseert de formatieve functie van toetsing te versterken en vaker te kiezen voor alternatieve vormen van toetsen en beoordelen. Daarnaast raadt hij het hoger onderwijs aan om de interne borging van de examenkwaliteit verder te versterken.

Breng toetsing in lijn met onderwijsdoelen, onderwijsinhoud en onderwijsmiddelen

Goed toetsbeleid begint in de ogen van de raad met de integratie van toetsing, onderwijsdoelen, onderwijsinhouden en onderwijsmiddelen.98 Dit wordt gezien als een kenmerk van succesvolle onderwijssystemen, omdat leerlingen hiermee optimaal kunnen profiteren van het onderwijsaanbod.99 Dit vraagt om een op uitkomsten gebaseerde benadering van onderwijs, waarbij van tevoren bepaald wordt wat de beoogde leeropbrengsten zijn. Onderwijsactiviteiten en evaluatiemethodieken worden dan, eveneens van tevoren, afgestemd op deze beoogde leeropbrengsten.100 Het principe klinkt voor de hand liggend, maar is dit in de huidige onderwijspraktijk geenszins. Het vraagt niet alleen dat leraren hun eigen onderwijspraktijk zorgvuldig onder de loep nemen en een eigen onderwijsvisie ontwikkelen101, maar het vraagt ook op verschillende organisatieniveaus (teamleiders, directie en bestuur) dat onderwijs en toetsing als samenhangend systeem beschouwd worden.102 In Nederland experimenteert vooral het hoger beroepsonderwijs met een dergelijke aanpak op systeemniveau van verbetering van onderwijskwaliteit.103 De raad ziet goede mogelijkheden voor dergelijke benaderingen in andere onderwijssectoren.

Bovengenoemde benadering zal er, als het goed is, toe leiden dat curriculum en toetsing gelijktijdig en in voortdurende onderlinge afstemming worden ontwikkeld en telkens weer worden verbeterd.104 Toetsing kan worden bekeken op het niveau van losse toetsitems, een losse toets en het programma van toetsen als geheel, zowel per domein of leergebied/vak als voor de hele opleiding. Voor elk van deze niveaus gelden verschillende kwaliteitscriteria.105 Goed toetsbeleid dat daadwekelijk bijdraagt aan de onderwijskwaliteit, adresseert al deze niveaus.106 Voor een criterium als validiteit betekent dit bijvoorbeeld dat het niet volstaat dat een toets op zichzelf aansluit bij de leerdoelen.107 Ook het programma van alle toetsen samen dient aan te sluiten bij de gestelde doelen. Toetsing en curriculum zijn op die manier niet los te zien van elkaar. Een heldere visie op toetsing dient daarom duidelijk te maken hoe het systeem van toetsing zich verhoudt tot het curriculum en hoe beide kunnen worden ontwikkeld zodat de samenhang tussen beide gewaarborgd is.

Een mogelijkheid is hierbij dat toetsing niet het sluitstuk, maar juist een integraal onderdeel vormt van het curriculumontwerp. De raad adviseert hierover in het briefadvies over curriculumherziening. In dat advies onderscheidt de raad drie processen bij curriculumvernieuwing. De overheid gaat over de herijking van kerndoelen en eindtermen. De onderwijsinstellingen zijn betrokken bij curriculumontwikkeling, inclusief toetsing, en bij onderwijsontwikkeling, inclusief toetsing.108 De raad roept onderwijsinstellingen, net als de rijksoverheid, op om rolvast te zijn in dit proces. De ruimte voor onderwijsinstellingen zit vooral in de onderwijsontwikkeling en de toetsing die daarmee gemoeid is. Die ruimte kunnen zij beter benutten dan nu het geval is.

Versterk de formatieve functie van toetsing voor het onderwijsleerproces

De raad beveelt aan om de formatieve functie van toetsing in het onderwijs te versterken. In de huidige toetspraktijk krijgen toetsen vooral beslissende functies toegekend. Deze zijn, zoals eerder beargumenteerd, nodig en van groot belang, maar dragen er in de huidige toetspraktijk ook aan bij dat formatieve functies nog relatief weinig aandacht krijgen. Om beter evenwicht binnen de dimensie beslissend-formatief aan te brengen, zal soms van beslissende functies moeten worden afgezien, of zal waar mogelijk aan deze functies minder gewicht moeten worden toegekend.

Onder formatieve functies worden in het onderwijsveld uiteenlopende dingen verstaan. De raad hanteert een ruime definitie, waarbij formatieve toetsing kan worden ingezet om onderwijsbeleid te verbeteren, het onderwijs af te stemmen op de behoefte van leerlingen, en het leerproces van leerlingen te initiëren, vorm te geven en te optimaliseren.109 Voor al deze verschillende formatieve functies geldt dat versterking nodig is. Het primair en het voortgezet onderwijs zetten toetsresultaten bijvoorbeeld beperkt in om onderwijsbeleid te verbeteren en doen te weinig aan feedback op het leerproces.110 Voor de leerling/student wordt vaak onvoldoende aangeven wat er precies goed ging en wat nog niet, wat zij nu nodig hebben, en wat hen te doen staat.111

Maar zelfs wanneer toetsing wel rijke feedback biedt, zoals uitvoerig commentaar op werkstukken, gebeurt het vaak dat leerlingen/studenten dit terzijde schuiven omdat zij geïnteresseerd zijn in het cijfer, en niet in het leren van hun fouten. Om een meer lerende houding bij hen te bewerkstelligen kan het helpen om minder vaak beslissend te toetsen. Een andere mogelijkheid is toetsen minder zwaar mee te laten tellen, zodat leerlingen/studenten het zich beter kunnen permitteren om een keer een lager cijfer te halen.112 Het wegnemen van de druk van beslissende toetsing kan ook op schoolniveau helpen om meer aandacht voor formatieve functies te krijgen. De schoolleiding kan er bijvoorbeeld voor zorgen dat ‘opbrengstgericht werken’ wordt vormgegeven vanuit intrinsieke motivatie en niet is ingegeven vanuit een afrekencultuur of is opgelegd door de Inspectie.113

Het reduceren van het gewicht van beslissende toetsing volstaat echter niet om formatieve toetsing succesvol te implementeren. Effectieve formatieve toetsing vergt uiteenlopende randvoorwaarden die betrekking hebben op de toets, de docent, de leerlingen en de context.114 Een voorbeeld van een randvoorwaarde met betrekking tot de toets is het formuleren van goede feedback. Goede feedback is doelgericht, beschrijvend en voldoende concreet (maar niet te gedetailleerd) en biedt ruimte voor verbetering.115 Randvoorwaarden voor docenten zijn bijvoorbeeld voldoende vakinhoudelijke kennis en het vermogen om toetsing te gebruiken bij de evaluatie van het onderwijsproces. Een voorbeeld van een randvoorwaarde voor leerlingen/studenten is het vermogen tot zelfreflectie. Randvoorwaarden in de omgeving zijn onder andere een coherent toetsbeleid en een lerende cultuur.

De lerende cultuur als voorwaarde van formatieve toetsing vraagt onder meer dat leerkrachten en docenten de resultaten van hun leerlingen zien als het resultaat van hun eigen handelen en niet alleen als het resultaat van de inzet van de leerling.116 Dat vraagt een bereidheid om te kijken naar eigen handelen en kritisch te reflecteren op de gevolgen hiervan: toetsresultaten geven informatie over de mate waarin leerlingen kunnen profiteren van het onderwijs dat docenten verzorgen. Alle sectoren van het onderwijs zijn hier al mee bezig, door middel van feedbacktrainingen, collegiale consultaties, het vormgeven van lerende organisaties en professionele leergemeenschappen, enzovoort. Er valt daar in alle sectoren echter nog veel winst te behalen.117

De lerende cultuur die nodig is voor formatieve toetsing hangt ook samen met het toetsbeleid. Zolang toetsen op zichzelf staan en aan het eind van een onderwijsonderdeel worden gegeven, zullen leerlingen en studenten weinig betekenis toekennen aan de feedback die ze krijgen. De volgende toets is waarschijnlijk toch weer anders. De lerende houding van leerlingen en studenten kan alleen tot stand komen als er samenhang tussen toetsen bestaat en als er sprake is van een langetermijnperspectief. Om deze reden is formatieve toetsing vaak in verband gebracht met programmatisch toetsen en visiegestuurd toetsbeleid.118

Gebruik vaker kwalitatieve en alternatieve toets- en beoordelingsvormen

Evenwichtig toetsen betekent dat naast gestandaardiseerde toetsen ook alternatieve vormen van toetsen worden gebruikt. Dit vraagt om positie innemen binnen de dimensie kwantitatief-kwalitatief. Er kan bijvoorbeeld meer geïntegreerd getoetst worden, zoals dat gebeurt bij de meesterproeven in het middelbaar beroepsonderwijs. De raad acht meesterproeven ook inzetbaar in andere sectoren. Naast geïntegreerde vormen van toetsing kunnen alle sectoren meer gebruikmaken van globale/holistische oordelen in plaats van de meer gebruikelijke analytische toetsen.119 Ook adviseert de raad om de mogelijkheden van digitale toetsing beter te benutten.120

Keuzes maken binnen de dimensie kwantitatief-kwalitatief kan ook tot gevolg hebben dat niet alle toetsresultaten uitgedrukt worden in een cijfer. De raad adviseert om, waar mogelijk en waar van toepassing, alternatieve vormen van beoordelen of inhoudelijke feedback te gebruiken. Cijfers liggen voor de hand en zijn handig voor het vergelijken van leerlingen en onderwijsinstellingen. Cijfers zijn voor sommige functies van toetsing ook noodzakelijk, bijvoorbeeld voor het civiel effect van examens. Cijfers kunnen echter ook bijdragen aan het verminderen van de aangeboren intrinsieke motivatie tot leren.121 Kinderen gaan door becijfering van hun inspanning leren voor een cijfer.122 Ook het langetermijnperspectief is voor leerlingen moeilijk vast te houden door de becijfering van hun inzet, ze leren van toets naar toets zonder samenhang in het curriculum te kunnen zien of voor ogen te kunnen houden waar ze naar toe werken.

Borg kwaliteit door versterken examencommissies in het hoger onderwijs

In het hoger onderwijs ziet de raad, ondanks de aandacht voor de rol en positie van examencommissies in de afgelopen jaren,123 nog ruimte voor verbetering. Vooral de rolvastheid van de verschillende commissies die betrokken zijn bij de kwaliteitszorg verdient aandacht. Formeel zijn examencommissies belast met de borging van de kwaliteit van tentamens en examens.124 De opleidingscommissie adviseert over het bevorderen en waarborgen van de kwaliteit van de opleiding.125 Examencommissies signaleren als er zaken niet goed verlopen in de toets- en examenpraktijk binnen een opleiding. Een examencommissie heeft een beperkt aantal instrumenten om zelf in te grijpen. Zo kan een commissie de aanwijzing van een docent als examinator intrekken126 of de richtlijnen aanscherpen.127 Een belangrijk aandachtspunt hierbij is dat docenten ook op de hoogte zijn van de richtlijnen en geborgd wordt dat richtlijnen daadwerkelijk effect op de onderwijspraktijk hebben. Verder kan een commissie signalen alleen doorspelen naar het management en bestuur van de opleiding. Deze laatste partijen zijn verantwoordelijk voor het verbetertraject. In de huidige toets- en examenpraktijk in het hoger onderwijs komt het voor dat de examencommissie signaleert en de opleidingscommissie de verantwoordelijkheid voor het verbetertraject oppakt, in plaats van het bestuur of het management. Hiermee ontstaat een complexe en onwenselijke dubbelrol voor de opleidingscommissie, die uiteindelijk zijn eigen vlees moet keuren.128

De raad wijst er verder op dat het functioneren van een examencommissie als formeel instrument voor kwaliteitsborging moet passen binnen het algehele kwaliteitsbeleid van een instelling en opleiding. In zijn advies Kwaliteit in het hoger onderwijs heeft de raad aandachtspunten benoemd voor de afstemming tussen effectieve kwaliteitszorg en een sterke kwaliteitscultuur op opleidingsniveau en wat dat betekent voor de opstelling van bestuurders en organen binnen een instelling.129 Een examencommissie zal in elk geval uit moeten gaan van de onderwijsvisie van de opleiding, zodat er geen frictie ontstaat tussen het toetsbeleid en wat docenten en studenten als opleidingsgemeenschap goed onderwijs vinden.130 Hetzelfde geldt voor de afstemming tussen het toetsbeleid en wat (nieuwe) docenten meekrijgen in het kader van professionaliseringsactiviteiten, zoals een bko- of bke-traject (respectievelijk basiskwalificatie onderwijs en basiskwalificatie examinering).

4. Vergroot de toetsdeskundigheid in het onderwijs

Voor een evenwichtige toetspraktijk is het vergroten van de toetsdeskundigheid in het onderwijsveld noodzakelijk. Dit is te realiseren door het aanpassen van beroepsstandaarden, het verbeteren van het aanbod in professionaliseringtrajecten, en het delen van informatie met alle gebruikers van toetsen.

Doordat instellingen niet vertrouwd zijn met formatieve toetsing en kwalitatieve toetsmethoden, wordt toetsing tot nu toe beperkt ingezet voor het geven van feedback. Dit leidt onbedoeld tot een versmalling van de focus van onderwijs. Ook leidt gebrek aan toetsdeskundigheid tot onnodig vaak uitbesteden van de vormgeving van toetsing aan externe partijen. Om de handelingsbekwaamheid en het eigenaarschap ten aanzien van toetsing te versterken is het nodig de toetsdeskundigheid van onderwijsprofessionals (waaronder leraren/docenten en schoolleiders/onderwijsmanagers) te vergroten. De raad adviseert de rijksoverheid en de beroepsverenigingen om de beroepsstandaarden van verschillende groepen onderwijsprofessionals te actualiseren en meer en beter aandacht te besteden aan toetsing in professionaliseringstrajecten. Daarnaast adviseert hij onderwijsprofessionals om hun kennis te delen met een bredere groep van betrokkenen, waaronder bestuurders en ouders. Deze andere betrokkenen hoeven geen toetsen te kunnen ontwikkelen, maar moeten wel toetsresultaten kunnen interpreteren en eventueel mee kunnen denken over het toetsbeleid.

4.1 Actualiseer professionele standaarden op het gebied van toetsing

Bij toetsing zijn verschillende groepen onderwijsprofessionals betrokken, waaronder leraren/docenten, leidinggevenden in het onderwijs, examenfunctionarissen, lerarenopleiders en toetsaanbieders. Hoewel niet iedere professional over dezelfde toetsdeskundigheid hoeft te beschikken, geldt voor al deze groepen dat het geheel van noodzakelijke kennis, vaardigheden en houdingsaspecten aanzienlijk is en op doelgerichte en samenhangende wijze nagestreefd dient te worden.131 De raad acht professionele standaarden daarbij zeer behulpzaam, mits deze standaarden voldoende specifiek, samenhangend en compleet zijn. Dat is op dit moment voor de meeste beroepsgroepen en sectoren niet het geval. Daarom adviseert de raad aan de rijksoverheid en de beroepsverenigingen om de professionele standaarden op het gebied van toetsing te actualiseren dan wel te ontwikkelen. Hieronder wordt nader toegelicht dat professionele standaarden zowel voor leraren/docenten als voor andere groepen professionals nodig zijn.

Formuleer omvattende bekwaamheidseisen en aanvullende richtlijnen voor leraren/docenten

Ten aanzien van toetsing zijn de huidige bekwaamheidseisen voor leraren/docenten in het primair en voortgezet onderwijs en het middelbaar beroepsonderwijs onvolledig en bovendien weinig concreet. Aanvullende richtlijnen, zoals de kennisbases voor lerarenopleidingen, schieten vaak ook tekort. De raad doet daarom de aanbeveling aan de rijksoverheid om de bekwaamheidseisen omvattend te maken ten aanzien van toetsing. Daarnaast beveelt hij overige relevante landelijke organisaties voor onderwijsgevend personeel aan om specifieke richtlijnen te onderscheiden, waarbij de eisen ten aanzien van toetsing bij elkaar staan en op complete wijze zijn uitgewerkt tot op het niveau dat ze goed toetsbaar zijn. Als voorbeeld kunnen hierbij de basis- en seniorkwalificaties examinering (bke en ske) van de Vereniging Hogescholen worden genomen.

Voor het primair en voortgezet onderwijs en het middelbaar beroepsonderwijs zijn de bekwaamheidseisen voor onderwijspersoneel wettelijk vastgelegd en onlangs herijkt.132 Een nadere specificatie van pedagogische, vakinhoudelijke en vakdidactische domeinen heeft geresulteerd in een aanzienlijk aantal verwijzingen naar toetsdeskundigheid. Dit geldt met name voor het didactische domein, waar is uitgegaan van een cyclische aanpak van observeren, toetsen, evalueren, bijstellen en ontwikkelen.133 De raad constateert met tevredenheid dat het uitgangspunt van een cyclische aanpak heeft gezorgd voor een ruime opvatting van toetsing, waarbij ook de formatieve functies een plaats krijgen. Het toetsen en evalueren is bij deze aanpak immers gericht op het bijstellen en (door)ontwikkelen van het onderwijs. Niettemin constateert de raad dat de herijkte bekwaamheidseisen niet compleet zijn. Dat wordt duidelijk als de eisen worden gelegd naast recente indelingen van toetsdeskundigheid die door onderzoekers zijn opgesteld.134 Opvallend afwezig zijn de eisen dat de leraar/docent externe toetsresultaten moet kunnen gebruiken voor onderwijsbeslissingen; dat hij resultaten en beslissingen moet kunnen communiceren naar de studenten, de schoolleiding en de ouders; en dat hij leerlingen moeten kunnen helpen om op basis van toetsinformatie de eigen leerstrategie te bepalen. Ook de wettelijke en ethische verantwoordelijkheden die de leraar of docent heeft ten aanzien van toetsing, blijven ongespecificeerd.135

De genoemde bekwaamheidseisen bieden onvoldoende houvast voor professionalisering, begeleiding en toezicht op het gebied van toetsdeskundigheid. Het is bijvoorbeeld niet duidelijk hoe de leraar of docent invulling kan geven aan “toetsen…ontwikkelen, toetsresultaten beoordelen, analyseren en interpreteren en de kwaliteit van toetsen en examens…beoordelen”136 of hoe kan worden geëvalueerd of de docent aan deze eis voldoet.

Beroepsstandaarden omvatten, naast de wettelijke bekwaamheidseisen, ook richtlijnen die tot op zekere hoogte een aanvulling of een uitwerking op de eisen bieden of een vertaling van het algemene aanbod van lerarenopleidingen. In het primair en voortgezet onderwijs zijn dit bijvoorbeeld Kennisbasis leraar basisonderwijs en Generieke kennisbasis voor tweedegraads lerarenopleidingen van de Vereniging Hogescholen, Vakspecifieke beroepsstandaarden Talen van de vereniging van Levende Talen137 en de Geactualiseerde kennisbasis van de Vereniging van Lerarenopleiders. Voorbeelden van aanvullende beroepsstandaarden in het middelbaar beroepsonderwijs zijn Kennisbasis Leraar Technisch Beroepsonderwijs van 10 voor de leraar en Specifieke beroepscompetenties van docenten in het middelbaar beroepsonderwijs van de Vereniging Hogescholen. In het hoger onderwijs zijn er basis en seniorkwalificaties onderwijs van de VSNU (vereniging van universiteiten) en de basis- en seniorkwalificatie examinering van de Vereniging Hogescholen.

Deze niet-wettelijke richtlijnen voor docentcompetenties of voor het aanbod van lerarenopleidingen blijven ten aanzien van toetsdeskundigheid vaak summier en incompleet. De Generieke kennisbasis voor tweedegraads lerarenopleidingen onderscheidt bijvoorbeeld relevante kernconcepten en kernmethodieken op het gebied van toetsing, maar een onderwerp als communicatie van toetsresultaten ontbreekt.138 Het blijft daarnaast onduidelijk wat precies van studenten op het gebied van toetsdeskundigheid wordt verwacht en hoe deze deskundigheid kan worden geëvalueerd. Een belangrijke uitzondering vormen de bke- en ske-eisen die de Vereniging Hogescholen recent heeft geformuleerd.139 De bke- en ske-eisen hebben een aantal belangrijke voordelen. Ze zijn verbonden met indicatoren die concreet maken wanneer docenten aan de eis voldoen. Daarnaast omvatten de eisen naast de vormgeving van toetsing bij afzonderlijke vakken ook de vormgeving van toetsing op het niveau van het curriculum. En ten slotte wordt een basisniveau gevolgd door een seniorniveau dat zich richt op de toetsing van grotere delen van het curriculum. Om deze redenen zouden het primair en voortgezet onderwijs en het middelbaar beroepsonderwijs hier een voorbeeld aan kunnen nemen. Dat geldt ook voor het wetenschappelijk onderwijs. Weliswaar maakt in deze sector toetsing onderdeel uit van de certificeringstrajecten bko en sko (basiskwalificatie en seniorkwalificatie onderwijs), maar deze eisen zijn ondanks landelijke afspraken verschillend per instelling140 en doorgaans minder omvattend en specifiek dan de bke- en ske-eisen in het hoger beroepsonderwijs. [139: HBO-raad vereniging Hogescholen, 2011.][140: Expertgroep BKE/SKE, 2013.][141: Inspectie van het Onderwijs, 2016b.]

Formuleer ook toetsingsstandaarden voor andere groepen onderwijsprofessionals

Professionele standaarden ten aanzien van toetsing zijn niet alleen nodig voor leraren/docenten, maar ook voor andere professionals. De beroepsprofielen van schoolleiders verwijzen bijvoorbeeld nauwelijks naar toetsdeskundigheid,141 terwijl de vormgeving van het toetsbeleid en het gebruik van toetsing voor de kwaliteitszorg taken van schoolleiders zijn. De raad adviseert beroepsverenigingen in alle onderwijssectoren de eisen op het gebied van toetsdeskundigheid van leidinggevenden nader uit te werken of vorm te geven142 en daarbij aan te sluiten bij de literatuur die hiervoor specifieke competenties onderscheidt.143 De raad acht dergelijke standaarden ook nodig voor lerarenopleiders en nascholers. Hun taken op het gebied van toetsing zijn tweeledig. Zij moeten er niet alleen voor zorgen dat zij de kwaliteiten van (aankomende) leraren en docenten op effectieve wijze beoordelen, maar moeten ook hun studenten/cursisten begeleiden bij het verwerven van toetsdeskundigheid. De landelijke beroepsstandaarden voor lerarenopleiders verwijzen echter slechts summier naar toetsdeskundigheid.144

4.2 Geef meer aandacht aan toetsing in professionaliseringstrajecten

Lerarenopleidingen besteden volgens de raad te weinig aandacht aan toetsdeskundigheid. Dat geldt ook voor andere individuele professionaliseringstrajecten, zoals de basiskwalificatie onderwijs in het wetenschappelijk onderwijs. De raad adviseert om in de verschillende trajecten niet alleen meer, maar ook meer gericht aandacht aan toetsing te geven. Hiertoe is het in de eerste plaats nodig om concrete beroepsstandaarden ten aanzien van toetsdeskundigheid te formuleren (zie paragraaf 4.1). Ten tweede beveelt de raad aan om naast geïntegreerde scholing in toetsing (als onderdeel van algemene didactiek of vakdidactiek) ook afzonderlijk onderwijs over toetsing te geven. Ten derde adviseert hij om de scholing in toetsing beter te borgen. Naast individuele professionaliseringstrajecten ziet de raad ook goede mogelijkheden om de toetsdeskundigheid te versterken via collectieve professionaliseringstrajecten.

Naast geïntegreerde ook afzonderlijke scholing in toetsing

Eerste- en tweedegraads lerarenopleidingen besteden in beperkte mate aandacht aan toetsingsvraagstukken. Nascholingstrajecten richten zich eveneens op het vergroten van toetsdeskundigheid. Deze scholing blijft echter vaak beperkt tot een korte cursus of zijdelingse behandeling van toetsthema’s. Niet alleen in Nederland, maar ook in andere landen wordt beperkt aandacht gegeven aan toetsing in lerarenopleidingen en nascholing. Scholing in toetsing in de Verenigde Staten bijvoorbeeld is wisselend, doorgaans kort, eenzijdig en niet passend bij de beleidsdoelstellingen. Terwijl het onderwijsbeleid bijvoorbeeld het belang van opbrengstgericht werken benadrukt, wordt aan formatieve toetsthema's zoals functies van toetsing en communicatie van toetsresultaten weinig aandacht geschonken.145 Een van de verklaringen voor de beperkte aandacht voor toetsing is dat toetsing vaak geïntegreerd is in algemene of vakdidactische cursussen waarin het ontwerpen van lessen en het lesgeven centraal staat.146 Het voordeel is dat duidelijk gemaakt kan worden dat toetsing nauw is verweven met vakinhoudelijke kennis en algemene didactische principes. Om een goede toets te maken, moeten leraren/docenten bijvoorbeeld begrijpen hoe het leerproces bij een bepaald vakdomein verloopt en hoe leerdoelen concreet kunnen worden gemaakt in toetstaken.147 Het risico van het integreren van het toetsingsonderwijs is dat het ondergesneeuwd raakt en dat daarmee de samenhang van theoretische noties van toetsing verloren gaat. Om die reden doet de raad de aanbeveling om toetsing ook als apart onderdeel in de opleiding op te nemen.

Borg scholing in toetsing

De beperkte aandacht voor toetsing in lerarenopleidingen is ook een gevolg van de ondergeschikte plaats die toetsing heeft in de kennisbasis van eerste- en tweedegraads lerarenopleidingen. Duidelijke eisen vormen een eerste aspect in de borging van het vergroten van toetsdeskundigheid. Een tweede facet is het toetsen van de eisen die aan toetsdeskundigheid worden gesteld. Dit gebeurt momenteel zeer beperkt. Zo vormt toetsdeskundigheid geen domein in de landelijke kennistoetsen die een groot deel van de tweedegraads lerarenopleidingen gezamenlijk afneemt. Een derde aandachtspunt voor borging is dat bij opleidingsaccreditaties de toetsdeskundigheid van studenten/cursisten een belangrijk onderdeel dient te vormen. Afgaand op de systeembrede analyses van de visitaties van de verschillende lerarenopleidingen is dat nu niet het geval.148 De raad is van mening dat de rijksoverheid via de Inspectie en de NVAO bijzondere aandacht zou moeten hebben voor het realiseren van de gestelde eisen ten aanzien van toetsdeskundigheid. Een dergelijke focus is gelegitimeerd, omdat toetsdeskundigheid van aankomende leraren een belangrijke waarborg vormt voor de onderwijskwaliteit in de sector waar ze les gaan geven. Het vierde aspect van borging is voldoende toetsdeskundigheid bij lerarenopleiders. Ook hiervoor geldt dat nadere specificatie van de beroepsstandaarden nodig is.

Neem misverstanden over toetsing weg

Traditioneel wordt toetsingsonderwijs gericht op het maken van een toets (het geheel van items en het scoringsvoorschrift) en het hanteren van de kwaliteitscriteria die daarvoor gelden, zoals betrouwbaarheid, validiteit, objectiviteit, normering en transparantie.149 Wanneer het toetsingsonderwijs hiertoe beperkt blijft, kan dit bijdragen aan de veelvoorkomende misconceptie dat ‘een goede toets’ volstaat. Zowel de eerste- en tweedegraads lerarenopleidingen als de basis- en seniorkwalificatie onderwijs en diverse nascholingsprogramma’s dienen te benadrukken dat toetsing ook het gebruik van toetsresultaten, het toetsprogramma als geheel, en de organisatie rondom toetsing omvat.150 Op dit meer systemische niveau van toetsing gelden andere kwaliteitscriteria, zoals aansluiting bij bredere onderwijsdoelen, vergelijkbaarheid van toetsresultaten, acceptatie van de toetsen, de betekenis die toetsing heeft voor betrokkenen, de authenticiteit van de toets, de herhaalbaarheid van toetsresultaten en de eerlijkheid van beslissingen die worden gebaseerd op toetsen.151 Uit trainingen die gericht zijn op de kwaliteit van toetsprogramma’s blijkt dat veel onderwijsprofessionals uit zichzelf deze bredere toetsingscriteria niet hanteren. Dat toetskwaliteit over meer gaat dan de toets beschouwen ze als een eye-opener.152 In het verlengde van een systemische benadering van toetsing kunnen andere veelvoorkomende misconcepties aan de orde komen, zoals het idee dat ondersteunende functies en beslissende functies van toetsing onverenigbaar zouden zijn (dit is een misverstand omdat feedback op toetsen met een beslissende functie juist waardevol is)153 of dat goede toetsing volledig objectief moet zijn (dit is een misverstand omdat maatregelen kunnen worden getroffen om met beoordelaarseffecten om te gaan).154

Oefenen van vaardigheden en langdurige professionalisering

Het wegnemen van misverstanden over toetsing en het bijbrengen van specifieke toetsingsconcepten zijn belangrijk, maar toetsdeskundigheid omvat ook vaardigheden. Lerarenopleidingen dienen tijd in te ruimen voor het oefenen, bijvoorbeeld in het gebruik van toetsmatrijzen. Het analyseren van toetsen en toetsitems is een complexe vaardigheid.155 Dat geldt ook voor het construeren van toetsen en toetsitems die aansluiten bij leerdoelen.156 Tegelijkertijd zijn deze vaardigheden essentieel om bijvoorbeeld geen reproductieve toetsen te geven wanneer het doel is om inzicht te meten.157

Verwerving van toetsdeskundigheid is een proces dat zich verder uitstrekt dan een lerarenopleiding of een enkele nascholingscursus.158 De raad doet de aanbeveling om verschillende professionaliseringstrajecten op elkaar te laten aansluiten, zodat onderwijsprofessionals gaandeweg hun deskundigheid kunnen verdiepen. Een goed voorbeeld in dit verband zijn de opeenvolgende trajecten van de basiskwalificatie examinering en de seniorkwalificatie examinering in het hoger beroepsonderwijs.159

Gezamenlijk ontwikkelen van toetsdeskundigheid

De kwaliteit van toetsing wordt niet alleen bepaald door afzonderlijke onderwijsprofessionals, maar ook door de mate waarin zij samenwerken. Gezamenlijke ontwikkeling van het toetsbeleid kan in belangrijke mate bijdragen aan de professionalisering van zowel de instelling als de individuele professionals.160 Een geschikt startpunt hierbij is de gezamenlijke analyse van de eigen toetspraktijk aan de hand van bewijsstukken, zoals verslagen van de examencommissie, toetsmatrijzen, trainingsmateriaal, resultaat- en ontwikkelingsgesprekken en studentevaluaties.161 Belangrijk bij deze collectieve projecten is dat de verschillende groepen onderwijsprofessionals en belanghebbenden bij toetsing zijn vertegenwoordigd.162 Om toetsing praktijkgericht te maken kan het verder zinvol zijn om professionals uit het beroepenveld erbij te betrekken.163 In alle gevallen is voldoende toetsexpertise van belang om de gezamenlijke projecten te begeleiden. Zo nodig dienen externe toetsexperts te worden ingeschakeld.164 Collectieve trajecten waarbij professionalisering en innovatie hand in hand gaan, hoeven uiteraard niet gebonden te zijn aan één instelling. Er zijn ook trajecten mogelijk waarbij verschillende instellingen toetsbeleid ontwikkelen, zoals de medische faculteiten doen.165 Andere vormen zijn instellingsoverstijgende leergemeenschappen of onderzoeksconsortia die professionalisering, innovatie en onderzoek op het gebied van toetsing combineren.

4.3 Deel informatie over toetsing met andere belanghebbenden

Naast onderwijsprofessionals hebben ook andere groepen belang bij toetsing – leerlingen, ouders, bestuurders, leden van medezeggenschapsorganen, beleidsmakers, werkgevers, politici en de burger in het algemeen. Toetsresultaten informeren deze groepen over onderwijsopbrengsten en de onderwijskwaliteit. Voor leerlingen/studenten geldt dat toetsing een belangrijke onderdeel van hun dagelijkse praktijk vormt en dat zij toetsresultaten kunnen benutten om hun leerproces te begrijpen en te optimaliseren.166 Voor al deze groepen is tot op zekere hoogte kennis over toetsing nodig. Kennis maakt het mogelijk om toetsresultaten goed te interpreteren en beredeneerd stelling te nemen in de discussie over de vormgeving van de toetspraktijk.

Er kan niet van alle belanghebbenden bij toetsing worden verwacht dat zij professionele scholing volgen. Het is wel reëel en wenselijk dat onderwijsprofessionals hen informeren over basale principes van toetsing. De raad beveelt onderwijsprofessionals daarom aan om hun toetsdeskundigheid te delen met bredere groepen belanghebbenden. Evenals bij onderwijsprofessionals geldt voor deze groepen dat het wegnemen van misconcepties over toetsing prioriteit heeft. Het delen van kennis over toetsing helpt onderwijsprofessionals om draagvlak te creëren en steun te organiseren voor het gevoerde toetsbeleid. Voor leerlingen/studenten geldt dat naast basale kennis over toetsen ook vaardigheden moeten worden onderwezen om toetsen te benutten voor het leerproces. Deze vaardigheden zijn nauw verweven met vaardigheden voor zelfstandig leren en vereisen langdurige oefening. Een ultiem doel daarbij is dat leerlingen/studenten gaandeweg beter in staat worden om zichzelf te toetsen167 of bruikbare peer feedback kunnen geven aan medeleerlingen/studenten.168

\

Bronnen

  1. Omwille van de leesbaarheid wordt in dit advies de term toetsing gebruikt, ook waar zowel toetsing als examinering wordt bedoeld. Waar het specifiek over examinering gaat, wordt dit aangegeven. Zie ook het kader in dit hoofdstuk.
  2. Onderwijsraad, 2015a.
  3. Berliner, 2011.
  4. Onderwijsraad, 2016a.
  5. Onderwijsraad, 2010b.
  6. Het blijkt echter niet eenvoudig om digitale adaptieve toetsen vorm te geven. Het College voor Toetsen en Examens kondigde recent aan dat de digitale adaptieve centrale eindtoets in 2019 niet beschikbaar is voor scholen. Dat komt doordat het systeem onvoldoende stabiel is om een goede afname van de toets te garanderen. Zie College voor Toetsen en Examens, 2018c.
  7. Onderwijsraad, 2018b.
  8. Onderwijsraad, 2017a.
  9. Archer, 2017; Newton, 2007; Newton, 2017.
  10. Bloom, Hastings, & Madaus, 1971; Black, 1998
  11. Newton, 2007.
  12. Onderwijsraad, 2016b.
  13. Leraren en docenten hebben met betrekking tot deze beoordelingsbevoegdheid een sterke juridische positie. Zie WPO artikel 31a, lid 2; WVO artikel 32e, lid 2; WEB artikel 4.1a.1, lid 2; WHW artikel 7.12c.
  14. Onderwijsraad, 2017a.
  15. Onderwijsraad, 2015a.
  16. Van der Vleuten, Schuwirth, Driessen, Govaerts, & Heenemans, 2015.
  17. Van der Vleuten, & Schuwirth, 2005.
  18. Moonen-van Loon, Overeem, Donkers, Van der Vleuten, & Driessen, 2013; Bouwer, Goossens, Mortier, Lesterhuis, & De Maeyer, 2018.
  19. Van der Vleuten, Schut, & Heeneman, 2018.
  20. Lynch, & Hennessy, 2017.
  21. Popham, 2001.
  22. Onderwijsraad, 2016a.
  23. Abrams, Pedulla, & Madaus, 2003.
  24. Er zijn uitzonderingen, bijvoorbeeld het praktijkexamen in het middelbaar beroepsonderwijs en het profielwerkstuk in het voortgezet onderwijs.
  25. Van der Vleuten, Schut, & Heeneman, 2018.]
  26. Inspectie van het Onderwijs, 2010.
  27. Onderwijsraad, 2011b.
  28. Onderwijsraad, 2016a.
  29. Inspectie van het Onderwijs, 2010, 2015a; Faber, Faber, Visscher, & Schut, 2015; Schildkamp, Heitink, Van der Kleij, Hoogland, Dijkstra, e.a., 2014.
  30. De Groot, 1966.
  31. Onderwijsraad, 2011b.
  32. Ministerie van Onderwijs, Cultuur en Wetenschap, 2017b.
  33. Onderwijs Innovatie Groep, 2013.
  34. Volman, Raban, Heemskerk, Ledoux, & Kuiper, 2018.
  35. Een integrale curriculumherziening in de Canadese provincie Quebec, die in 1996 werd ingezet, is bijvoorbeeld ten dele mislukt omdat de toetsing niet mee ontwikkelde; zie Conseil Supérieur de l’Education Quebec, 2014.
  36. Ministerie van Onderwijs, Cultuur en Wetenschap, 2018b.
  37. Onderwijsraad, 2018a.
  38. Van den Bergh, Rohde, & Zwarts, 2003.
  39. College voor Toetsen en Examens, 2018b.
  40. Andere verplichte vakken zijn: maatschappijleer, culturele en kunstzinnige vorming , lichamelijke opvoeding en rekenen. Voor deze vakken worden geen centrale examens, maar wel schoolexamens afgenomen (voor rekenen gebeurt dit vanaf schooljaar 2019-2020; van pogingen tot centrale examinering van het rekenonderwijs is inmiddels afgezien). Het gemiddelde cijfer voor deze vakken is opgenomen in de zak- slaagregeling en kan bepaalde resultaten compenseren. Dit geldt ook voor keuzeonderdelen, waaronder het profielwerkstuk. Zie College voor Toetsen en Examens, 2018b.
  41. Centrale Examencommissie Vaststelling Opgaven, 2006; Rekers-Mombarg, Harms, & Van der Werf, 2009; Lange & Dronkers, 2007
  42. Canton, Aler, Heemskerk, Van der Westen, & Willemsen, 2013.
  43. Wanneer het verschil drie jaren achtereen groter is dan een halve punt, dient de Inspectie dit aan de Minister melden en komt de examenlicentie van de school in het geding. Zie Inspectie van het Onderwijs, 2018e.
  44. Inspectie van het Onderwijs, 2014.
  45. MBO Raad, 2015.
  46. Karsten (2016) noemt als begin van deze ontwikkeling de nota Beroepsprofiel en leerplanontwikkeling van het Ministerie van OCW uit 1986.
  47. MBO Raad, 2015; Kennispunt MBO Onderwijs en examinering, 2017.
  48. MBO Raad, 2018.
  49. Inspectie van het Onderwijs, 2014.
  50. Karsten, 2016.
  51. Rouwhorst, Sinke, Van Kessel, & Zondervan, 2017.
  52. Commissie Externe Validering Examenkwaliteit Hoger Beroepsonderwijs, 2012.
  53. Sursock, Smidt, & Davies, 2010.
  54. Behalve door het idee van flexibele modules is deze toetsing per onderdeel ook ingegeven door beleidsdoelstellingen om studenten regelmatiger te laten studeren en de studielast beter te spreiden in vergelijking met bijvoorbeeld een aanpak waarbij examinering op het eind van de studiejaar plaatsvindt (Inspectie van het Onderwijs, 2009).
  55. De NVAO verleent ook accreditaties aan instellingen, maar toetsing van leerresultaten komt daarbij meer zijdelings aan de orde (bij standaard 4: evaluatie en monitoring).
  56. Nederlands-Vlaamse Accreditatieorganisatie, 2016.
  57. Een belangrijke aanleiding hiervoor vormden een aantal incidenten medio 2010 waarbij kwaliteitsgebreken op het gebied van toetsing in het hoger beroepsonderwijs aan het licht kwamen. Zie Commissie Externe Validering Examenkwaliteit Hoger Beroepsonderwijs, 2012
  58. Inspectie van het Onderwijs, 2016a.
  59. Dronkers, Elffers, Karsten, & Van der Velden, 2016; Feron, Schils, & Ter Weel, 2016.
  60. Huygen, 2016.
  61. Ministerie van Onderwijs, Cultuur en Wetenschap, 2018a.
  62. Ministerie van Onderwijs, Cultuur en Wetenschap, 2017a.
  63. Ministerie van Onderwijs, Cultuur en Wetenschap, 2018c.
  64. Rijksoverheid, 2018
  65. Expertgroep Doorlopende Leerlijnen Taal en Rekenen, 2008.
  66. College voor Toetsen en Examens, 2018a.
  67. Commissie Verantwoorde Invoering Rekentoets, 2014; Bosker, & Van de Vorle, 2014.
  68. Zie College voor Toetsen en Examens, 2015; Ministerie van Onderwijs, Cultuur en Wetenschap, 2015.
  69. Ministerie van Onderwijs, Cultuur en Wetenschap, 2018c.
  70. Ministerie van Onderwijs, Cultuur en Wetenschap, 2018d.
  71. Voor- en tegenstanders over de Cito kleutertoets, 2018.
  72. Voor 2019 kunnen scholen kiezen uit de volgende toetsen: centrale eindtoets po van het College voor Toetsen en Examens; eindtoets ROUTE 8 van A-VISION; IEP-eindtoets van Bureau ICE; DIA-eindtoets van Diataal; AMN-eindtoets van AMN.
  73. Glas, Emons, & Berding-Oldersma, 2016.
  74. Inspectie van het Onderwijs, 2017.
  75. Inspectie van het Onderwijs, 2018a.
  76. Onderwijsraad, 2014, 2015a, 2017b.
  77. Van de Werfhorst, Elffers & Karsten, 2015.
  78. Het College voor Toetsen en Examinens probeert met Project Ieders Examen het draagvlak voor examens te vergroten. Zij betrekt vakverenigingen meer bij het vaststellen van correctievoorschriften om zo meer consensus over de voorschriften te ontwikkelen. Ook geeft zij, bijvoorbeeld via webinars meer openheid over de procedures voor de ontwikkeling van examens en scoringsvoorschriften.
  79. Onderwijsraad, 2015a.
  80. Dublin-descriptoren zijn de Europese eindtermen voor het hoger onderwijs. Zie Bologna Working Group, 2005.
  81. Onderwijsraad, 2011b.
  82. Onderwijsraad, 2010a.
  83. Commissie Externe Validering Examenkwaliteit Hoger Beroepsonderwijs, 2012.
  84. Verhoeven, Snellen-Balendong, Hay, Boon, Van der Linde, e.a., 2005. Zie ook Organisation for Economic Co-operation and Development, 2015.
  85. Inspectie van het Onderwijs, 2018b.
  86. Onderwijsraad, 2016a.
  87. De Boer, Bosker, & Van der Werf, 2010; Timmermans, Kuyper, & Van der Werff, 2013; Lenhard & Schröppel, 2014.
  88. Inspectie van het Onderwijs, 2018d.
  89. Onderwijsraad, 2014.
  90. Onderwijsraad, 2017c.
  91. Inspectie van het Onderwijs, 2018f.
  92. “De risico-regelreflex is de neiging om het voortdurend verminderen van risico’s, al dan niet naar aanleiding van een incident, als vanzelfsprekende opgave aan te merken. Deze reflex kan leiden tot disproportionele ingrepen: maatregelen waarvan de baten bij nadere beschouwing duidelijk niet opwegen tegen de kosten en de maatschappelijke bijwerkingen, of waarbij van de overheid meer wordt verwacht dan nodig of realiseerbaar is. Maatregelen kunnen uiteenlopen van wet- en regelgeving en normstelling tot toezicht, uitvoeringsmaatregelen en systeemveranderingen.” Definitie afkomstig uit Trappenburg, 2011.
  93. Inspectie van het Onderwijs, 2018c.
  94. Inspectie van het Onderwijs, 2018c.
  95. Inspectie van het Onderwijs, 2016b.
  96. WHW 7.12b, lid 1a.
  97. Zie ook Onderwijsraad, 2015b, waarin de raad adviseert over examencommissies in het hoger onderwijs.
  98. Organisation for Economic Co-operation and Development, 2010.
  99. Scheerens, 2017; Scheerens & Exalto, 2017.
  100. Biggs, 1996; Biggs, 2014.
  101. Schönwetter, Sokal, Friesen, & Taylor, 2002.
  102. Schildkamp, Heitink, Van der Kleij, Hoogland, Dijkstra, e.a., 2014.
  103. Van Schilt-Mol, Sluijsmans, Peters, De Beer, & Jakobs, 2016; Sluijsmans, Joosten-ten Brinke, & Van Schilt-Mol, 2015.
  104. In de software-ontwikkeling wordt gesproken van ‘iteratieve en incrementele ontwikkeling’. Deze termen zijn vooral bekend sinds de introductie van ‘agile’ ontwikkelmethoden in dit vakgebied. Zie bijvoorbeeld Larman & Basili, 2003 en http://agilemanifesto.org/.
  105. Kwaliteitscriteria op toetsitemniveau zijn: relevantie, objectiviteit, efficiëntie en moeilijkheid. Kwaliteitscriteria op toetsniveau zijn: validiteit, betrouwbaarheid, objectiviteit, transparantie en normering. Kwaliteitscriteria op toetsprogrammaniveau zijn: passenheid bij doel, vergelijkbaarheid, acceptatie, betekenis, reproduceerbaarheid, eerlijkheid, zelf-toetsing, authenticiteit. Zie Sluijsmans, Peeters, Jakobs, & Weijzen, 2012.
  106. Van Schilt-Mol, e.a., 2016.
  107. Baartman, & Gulikers, 2014.
  108. Onderwijsraad, 2018a.
  109. In dit verband wordt ook gesproken van ‘assessment for learning’ (Schildkamp e.a., 2014)
  110. Inspectie van het Onderwijs, 2018a.
  111. ‘Feed up’ informatie beschrijft wat de prestatiedoelen zijn, wat leerlingen moeten leren en welke criteria hiervoor gehanteerd worden. ‘Feed back’ informatie geeft aan in hoeverre die doelen al zijn bereikt. ‘Feed forward’ informatie geeft aan welke strategieën kunnen worden ingezet om de gestelde doelen te bereiken. Zie Fisher, & Frey, 2009; Hattie, & Timperley, 2007; Wiliam, 2016.]
  112. Onderwijsraad, 2017b.
  113. Schildkamp e.a., 2014.
  114. Schildkamp e.a., 2014.
  115. Gulikers & Baartman, 2016; Yeh, 2010.
  116. Abrams e.a., 2003.
  117. Onderwijsraad, 2016b.
  118. Schuwirth & Van der Vleuten, 2011; Dijkstra, Van der Vleuten, & Schuwirth, 2010.
  119. Van der Vleuten & Schuwirth, 2005.
  120. Zie ook Onderwijsraad, 2017a.
  121. Carbonneau, Vallerand, & Lafrenière, 2012; White, 1959; Lepper, Greene, & Nisbett, 1973.
  122. Butler & Nisan, 1986; Pulfrey, Darnon, & Butera, 2013.
  123. Inspectie van het Onderwijs, 2015b; 2016c. Zie ook https://zoek.officielebekendmakingen.nl/stb-2016-273.html]
  124. WHW artikel 7.12b.
  125. WHW artikel 9.18.
  126. WHW artikel 7.12c. De wet zelf spreekt alleen over aanwijzing van examinatoren, uit jurisprudentie volgt echter dat intrekking ook kan, mits dit goed gemotiveerd is.
  127. WHW artikel 17.12b, lid 1, onder b.
  128. Van den Berg, 2018; Van de Veen, Pol, & Moerkerke, 2018.
  129. Onderwijsraad, 2015b.
  130. De examencommissie dient in dit kader te werken binnen het kader van de Onderwijs- en Examenregeling (WHW 7.12b lid1 onder b).
  131. Brookhart, 2011.
  132. Besluit bekwaamheidseisen onderwijspersoneel, 16 maart 2017.
  133. Onderwijscoöperatie, 2016.
  134. Brookhart, 2011; DeLuca & Bellara, 2013; Mandinach, & Gummer, 2016.
  135. Vergelijk Brookhart, 2011.
  136. Besluit bekwaamheidseisen onderwijspersoneel, artikel 2.9k.
  137. De Graaff & Bodde, 2009.
  138. HBO-raad vereniging Hogescholen, 2011.
  139. Expertgroep BKE/SKE, 2013.
  140. Inspectie van het Onderwijs, 2016b.
  141. Krüger & Andersen, 2017; VO Academie, 2014; Basoski & Koot, 2014.
  142. Voor onderwijsmanagers in het hoger onderwijs geldt dat er nog geen landelijke beroepsstandaarden zijn. Weliswaar worden professionaliseringstrajecten als Onderwijskundig leiderschap in het hoger onderwijs afgesloten met een certificaat, maar de bekwaamheidseisen van dergelijke trajecten lopen uiteen tussen instellingen.
  143. McMillan, 2000; Hargreaves, Boyle, & Harris, 2014.
  144. Velon, 2018.
  145. Greenberg, & Walsh, 2012; DeLuca & Bellara, 2013.
  146. DeLuca & Bellara, 2013.
  147. Baartman & Gulikers, 2014; Sluijsmans e.a., 2012.
  148. Nederlands-Vlaamse Accreditatieorganisatie, 2016.
  149. Baartman, 2008.
  150. Dat gebeurt nu in Nederland nog te weinig. Zie: Joosten-Ten Brinke, 2011; Sluijsmans e.a., 2012; Van Schilt-Mol e.a., 2016. Ook in andere landen, zoals de Verenigde Staten krijgen ‘formatieve toetsthema's’, zoals functies van toetsing en communicatie van toetsresultaten doorgaans weinig aandacht (Greenberg & Walsh, 2012; DeLuca & Bellara, 2013).
  151. Baartman, 2008; Gulikers, Sluijsmans, & Baartman, 2008.
  152. Gulikers, & Baartman, 2016; zie ook DeLuca & Bellara, 2013, die in dit verband spreken van ‘een omslag in het denken’.
  153. Baartman & Gulikers, 2014.
  154. Van der Vleuten, Norman & Graaff,1991.
  155. Krathwohl, 2002.
  156. Baartman & Gulikers, 2014; Sluijsmans e.a., 2012.
  157. Brookhart, 2011.
  158. Schildkamp e.a., 2014.
  159. Expertgroep BKE/SKE, 2013.
  160. Van Schilt-Mol e.a., 2016.
  161. Sluijsmans e.a., 2012.
  162. Van Schilt-Mol e.a., 2016.
  163. Schildkamp e.a., 2014.
  164. Van Schilt-Mol e.a., 2016.
  165. Van der Vleuten e.a., 2018.
  166. Brookhart, 2011.
  167. Adesope, Trevisan, & Sundararajan, 2017.
  168. Dochy, Segers, & Sluijsmans, 1999.