Denne undersøgelse er en del af en større evaluering af de nationale test, som Styrelsen for Undervisning og Kvalitet (STUK) under Børne- og Undervisningsministeriet har bedt VIVE gennemføre.
VIVEs samlede evaluering analyserer både brugen af nationale test og giver viden om, hvordan nationale test kan bruges og udvikles fremadrettet.
Evalueringen danner derfor også grundlag for den rådgivningsgruppe, som ministeriet har nedsat til at komme med anbefalinger omkring de nationale test.
VIVEs evaluering belyser både styrker og svagheder i indholdet og brugen af de nationale test i folkeskolen. Evalueringen udmønter sig i fem delrapporter og en tværgående evalueringsrapport.
Denne rapport indgår som delrapport 3 af 5.
Delrapport 3 har til formål at kortlægge, hvilke test der findes, som i formål, indhold og omfang minder om de danske nationale test. Der er tale om test i lande, der er sammenlignelige med Danmark.
Resultater
Undersøgelsen bygger på en systematisk søgning, der identificerede 106 forskellige test. Af de 106 test har det kun i 8 tilfælde været muligt at indhente fuld information om alle karakteristika for testene. 56 af de 106 test kommer fra USA, 14 fra Danmark, mens resten kommer fra andre lande.
90 procent af testene i USA og Europa bliver brugt i indskolingen. De er dog ikke nødvendigvis kun udviklet til indskolingen, og nogle test bruges også på mellemtrinnet og i udskolingen. I USA er de fleste test for eksempel målrettet hele skolegangen.
De identificerede test er typisk tænkt som pædagogiske værktøjer. Uden for Europa ses også, at testene i udpræget grad har styring som formål. Her er halvdelen af dem tænkt som en kombination af styringsredskab og pædagogisk værktøj.
De nationale test minder om andre test med lignende formål
De danske nationale test er karakteriseret ved både at være tænkt som et pædagogisk værktøj og et styringsredskab. De er målrettet de fleste årgange på tværs af indskolingen, mellemtrinnet og udskolingen.
Sammenholder vi disse karakteristikker med de test, vi har fundet i litteratursøgningen, kan vi se, at når test både har et formål som pædagogisk værktøj og styringsredskab, så målrettes de i høj grad til hele skolegangen. Resultaterne af testen vil også i udpræget grad blive rapporteret til både hjemmet, læreren og myndighed, præcis som det også sker med de danske nationale test.
De danske nationale test varer typisk en lektion, det vil sige 45 minutter. Det er kortere tid end de øvrige test med samme anvendelsesformål.
Den adaptive testform – altså at testen i testsituationen tilpasser sig den enkelte elevs faglige niveau – er ikke særlig udbredt, og litteratursøgningen identificerede ingen andre adaptive test i Norden.
Litteratursøgningen viste desuden, at information om en tests pålidelighed var svær at indhente og sammenligne. En egentlig vurdering af de nationale tests pålidelighed i forhold til andre test vil derfor kræve en dybere undersøgelse af hver enkelt test, der sammenlignes med.
Metode
Kortlægningen tager udgangspunkt i en systematisk litteratursøgning efter pædagogiske og psykonometriske test, foretaget af VIVEs forskningsbibliotek. På baggrund af denne søgning har vi dannet et overblik over de anvendte test, der opfylder en række inklusions- og eksklusionskriterier.
Litteratursøgningen identificerede 106 test, der efterfølgende dannede grundlag for en analyse, hvor vi sammenlignede en række karakteristika inden for tre overordnede emner: Testenes indhold, design og afrapportering. For testenes indhold kan nævnes blandt andet anvendelsesformål og målgruppe. Design består blandt andet af, hvorvidt testen er adaptiv eller lineær, om den anvender Item Response Theory m.m. Indholdet beskriver blandt andet, om information om testens resultater sendes til elev/forældre, lærere eller myndighed.
Om denne udgivelse
Styrelsen for Undervisning og Kvalitet (STUK)
VIVE - Det Nationale Forsknings- og Analysecenter for Velfærd