VIVE har gennemført en omfattende evaluering af de nationale test i grundskolen. Evalueringen indeholder en række analyser af både selve indholdet af de nationale test og af, hvordan testene anvendes af lærere, skoleledere, kommuner og på politisk niveau.
Evalueringen er gennemført for Børne- og Undervisningsministeriet og belyser både styrker og svagheder ved de nationale test. Samtidig danner evalueringen grundlag for den rådgivningsgruppe, som ministeriet har nedsat for give anbefalinger til den fremtidige brug af nationale test.
Målingerne er usikre på elevniveau
En af analyserne i VIVEs evaluering viser, at de nationale test er usikre på elevniveau, og at man bør være påpasselig med at anvende en enkelt elevs resultat som enkeltstående udtryk for elevens faglige niveau. Resultatet er for usikkert til, at det kan stå alene. Den usikkerhed, der er forbundet med resultatet for den enkelte elev i de nationale test, vil man imidlertid også finde i andre test.
– Der er altså ikke noget, der tyder på, at de nationale test er mere eller mindre usikre end andre tilsvarende test, siger chefanalytiker i VIVE Lasse Hønge Flarup.
Ligesom andre faglige test måler de nationale test ikke et helt fag, men kun dele af det. De viser altså ikke elevers fulde kunnen inden for et fag, men alene inden for de områder, der testes i.
Flere veje til at øge præcisionen i målingerne
Der er dog flere måder at gøre resultaterne mere sikre. For eksempel påpeger både Styrelsen for It og Læring (STIL) i deres evaluering af de statistiske aspekter af testene og VIVE, at der i dag er for få svære opgaver i testens opgavebank. Indføring af flere svære opgaver forventes at kunne øge sikkerheden i testene og dermed øge præcisionen i de nationale test.
I dag tester man eleverne i tre profilområder inden for hver enkelt fag. For eksempel omfatter den nationale test i dansk (læsning) de tre profilområder sprogforståelse, afkodning og tekstforståelse. Det betyder, at resultaterne på de enkelte områder bliver mere usikre, end hvis man samlede resultaterne til ét fagligt resultat. Man bør derfor undersøge nærmere, om der er belæg og behov for tre profilområder af faget for hver af de nationale test.
Målingerne er mere sikre på aggregeret niveau
Debatten om, hvorvidt man kan stole på resultaterne af de nationale test, har fyldt meget og været medvirkende til, at praktikere har tvivlet på anvendeligheden af de nationale test – både på individniveau og på aggregeret niveau. Som sagt er resultaterne usikre på elevniveau, men den usikkerhed er ikke tilsvarende for resultater på aggregeret niveau.
Resultaterne er mere sikre i aggregeret form og mere anvendelige til styring på et mere overordnet niveau, viser VIVEs analyser. De nationale test har høj eksternt validitet, hvilket betyder, at de kan bruges som et generelt udtryk for elevernes faglige niveau.
– Man kan altså godt bruge resultater på aggregeret niveau til at give et generelt billede af, hvor eleverne ligger fagligt. Men man skal selvfølgelig anvende dem inden for de metodiske rammer for data af denne type, siger chefanalytiker i VIVE Lasse Hønge Flarup.
Sammenhæng mellem karakterer og testresultater
Der er sammenhæng mellem de resultater, eleverne får i de nationale test, og deres standpunktskarakterer og karakterer ved 9. klasses-prøver. Og jo tættere afgangsprøver eller karaktergivning og test tidsmæssigt falder sammen, jo større er overensstemmelsen.
Samtidig viser VIVEs evaluering, at det faglige niveau i de nationale test i de små klasser følger eleverne op gennem skoletiden. Elever, der klarede sig godt i nationale test i de første år, klarer sig også godt ved 9. klasses-prøver.
Testsituationen rummer dilemmaer
Nogle elever oplever selve testsituationen som positiv, mange oplever den som neutral, og kun få oplever den negativt. Dog har især de yngre elever udfordringer med længden af testen og har svært ved at fastholde koncentrationen.
Længde og præcision hænger imidlertid sammen. Jo længere en test er, jo mere præcis forventes den også at være. Testens adaptive princip er i teorien med til at forkorte testens længde, da det gør det muligt hurtigere at finde elevens niveau. Afskaffer man det princip, vil det alt andet lige kræve en længere test for at opnå et lige så præcist resultat.
Lærere skeptiske og usikre på brugen af test
Generelt er lærerne skeptiske over for nationale test som pædagogisk redskab. Usikkerhed omkring resultaterne på elevniveau gør det vanskeligt at anvende dem i det pædagogiske arbejde – også selv om lærerne ifølge VIVEs undersøgelse oftest oplever, at deres opfattelse af elevernes faglige niveau stemmer overens med elevernes resultater i testene.
På klasseniveau er der bedre muligheder for at anvende resultaterne som pædagogisk redskab. Men lærerne er usikre på, hvordan man omsætter viden fra testene til pædagogisk praksis. Uklarheden kan både skyldes mangel på viden, mangel på tid, og at debatten om resultaternes sikkerhed har fyldt så meget.
Der er også kun i mindre grad fastlagt klare retningslinjer på skolerne for, hvordan man bruger test som pædagogisk redskab. Ofte er det op til den enkelte lærer, om og i så fald hvordan de nationale test skal bruges i den pædagogiske praksis.
Fylder kun lidt i evalueringskulturen
Både skoleledere og lærere mener generelt, at evaluering er et vigtigt redskab i arbejdet med at styrke den faglige kvalitet på skolerne. De er også enige om, at de har kompetencerne på skolerne til at evaluere.
Men der er forskel på skoleledernes kendskab til og systematik i at følge op på test- og evalueringsresultater. Og generelt bliver nationale test ikke opfattet som et redskab, der understøtter skolernes evalueringskultur. Det hænger ifølge VIVEs undersøgelse sammen med, at både skoleledere og lærerne er skeptiske over for, om testene er pålidelige.
Et vigtigt redskab i kommunen
De kommunale forvaltningschefer vurderer i VIVEs undersøgelse, at de nationale test styrker deres mulighed for at følge med i skolernes udvikling, og at testene danner et godt udgangspunkt for dialog med skolerne. Det synspunkt deler skolelederne til en vis grad.
Forvaltningscheferne mener også, at det er vigtigt at have nationale målinger, der gør det muligt at vurdere, om kommunens elever har særlige udfordringer i forhold til andre steder i landet.
Skolelederne er mere delte. Stort set lige mange af dem er positive og negative over for testene som ledelsesinformation om elevernes faglige niveau. Skolelederne ser mest positivt på testene som et middel til at følge elevernes udvikling.
Begge grupper mener dog, at nationale test ikke kan stå alene, men skal suppleres med andre datakilder, ligesom det er beskrevet i vejledningerne til de nationale test.
Øget brug af frivillige test
Omfanget af frivillige nationale test er steget betragteligt over en periode på seks skoleår, viser VIVEs undersøgelse. Det er der flere grunde til. En af dem er, at kommuner og skoler gerne vil kunne følge elevernes udvikling. En anden er, at både forvaltninger, skoleledere og lærere har et ønske om at gøre eleverne mere trygge ved testene, så de er bedre forberedt til de obligatoriske test,
– Det er jo positivt, hvis man bruger testen for at kunne følge og understøtte faglig progression for eleverne. Men omvendt kan der opstå det, vi kalder ’teaching to the test’, altså at man bruger de frivillige test til at øve sig til den obligatoriske, alene for at få et bedre testresultat, siger Lasse Hønge Flarup.
Behov for udvikling
VIVEs evaluering viser, at der er behov for data, der kan bruges pædagogisk af lærerne i skolerne, og som styringsredskab på højere niveauer. Og VIVE vurderer, at hvis de nationale test afskaffes, så vil der være behov for at udvikle et eller flere nye redskaber, der kan erstatte dem, og som kan indgå i samspil med andre eksisterende datakilder, for eksempel trivselsmålinger og karakterer ved afgangsprøver.
Hvis man ikke afskaffer de nationale test, er der behov for at arbejde med testens pålidelighed og usikkerheden omkring resultater på elevniveau. Det skal også gøres nemmere for lærere og skoleledere at arbejde konstruktivt med testene – eksempelvis gennem bedre vejledninger og mere handlingsorienteret oversættelse af data til pædagogisk anvendelse. Og så bør man arbejde med fortællingen om, hvad de nationale test egentlig kan og skal måle og anvendes til, og hvad de ikke skal.