Testcores van studenten Vertel ons meer over de community waarin zij leven dan wat ze weten

Elk jaar nemen beleidsmakers in de VS levensveranderende beslissingen op basis van de resultaten van gestandaardiseerde tests. Deze beslissingen met een hoge inzet omvatten, maar zijn niet beperkt tot, studentenpromotie naar het volgende leerjaar, het in aanmerking komen voor studenten om deel te nemen aan geavanceerde cursussen, in aanmerking komen om de middelbare school af te studeren en docenten te studeren. In 40-staten, leraren worden geëvalueerd deels gebaseerd op de resultaten van door studenten gestandaardiseerde tests, net als schoolbeheerders in bijna 30-staten.

Uit onderzoek blijkt echter dat de uitkomsten van gestandaardiseerde tests niet de kwaliteit van de instructie weerspiegelen, zoals ze bedoeld zijn. Collega's en ik hebben studies uitgevoerd in New Jersey, Connecticut, Massachusetts, Iowa en Michigan.

De resultaten laten zien dat het mogelijk is om de percentages te voorspellen van studenten die bekwaam of beter zullen scoren op sommige gestandaardiseerde tests. We kunnen dit doen door alleen naar enkele van de belangrijke kenmerken van de gemeenschap te kijken, in plaats van factoren gerelateerd aan de scholen zelf, zoals verhoudingen tussen docenten en docenten of de kwaliteit van de docenten.

Dit verhoogt de mogelijkheid dat er ernstige tekortkomingen zijn ingebouwd in de systemen voor verantwoording van het onderwijs en de beslissingen over opvoeders en studenten die in die systemen zijn gemaakt.

Gestandaardiseerde tests

De scores van studenten op gemandateerde gestandaardiseerde tests zijn gebruikt om Amerikaanse opvoeders, studenten en scholen te evalueren sinds president George W. Bush de Geen kind achtergelaten wet (NCLB) in 2002.

Hoewel meer dan 20-staten eerder door de late 1990s in staat waren getest in sommige niveaus, stelde NCLB jaarlijkse gestandaardiseerde testen verplicht in alle 50-staten. Het vereiste gestandaardiseerde wiskunde en Engelse taalvaardigheidstests in de klassen drie tot acht en eenmaal op de middelbare school. Ambtenaren van de staatsonderwijs moesten ook een gestandaardiseerde wetenschapstest in vierde rang, achtste rang en eens op middelbare school beheren.


innerlijk abonneren grafisch


De Obama-administratie breidde gestandaardiseerde tests uit door middel van vereisten in het Race to the Top-beurzenprogramma en financierde de ontwikkeling van twee nationale gestandaardiseerde tests met betrekking tot Common Core State Standards: Smarter Balanced Assessment Consortium (SBAC) en de Partnerschap voor beoordeling van gereedheid van universiteit en loopbaan (PARCC).

Vijfenveertig staten namen aanvankelijk de Common Core in enige vorm aan. Ongeveer 20 maakt momenteel deel uit van de PARCC- of SBAC-consortia. Belangrijke delen van Race to the Top-applicaties die worden vereist, gebruiken testresultaten van studenten om docenten en opdrachtgevers te evalueren.

Voorspelling van scores

Het is al goed ingeburgerd dat buitenschoolse, community demografische en gezinsniveau variabelen sterk invloed hebben op de prestaties van studenten op grootschalige gestandaardiseerde tests.

Bijvoorbeeld gemiddeld gezinsinkomen is een sterke voorspeller van SAT-resultaten. Andere factoren die sterk verband houden met prestaties op door de overheid gestandaardiseerde tests, zijn het opleidingsniveau van de ouders, het percentage alleenstaande ouders in de schoolgemeenschap en het percentage gezinnen dat in armoede leeft in de gemeenschap.

We besloten om te kijken of we gestandaardiseerde testscores konden voorspellen op basis van demografische factoren gerelateerd aan de gemeenschap waar een student woonde. Door te kijken naar drie tot vijf demografische variabelen van de gemeenschap en familie uit US Census-gegevens, we zijn in staat geweest om nauwkeurig te voorspellen de percentages van studenten die bekwaam of hoger scoren op gestandaardiseerde testscores voor rangen drie tot en met 12. Deze voorspellingen zijn gedaan zonder te kijken naar gegevens van schooldistrictgegevens, zoals de grootte van de school, de ervaring van de leraar of de uitgaven per leerling.

Onze modellen kunnen bepalen hoeveel een bepaalde variabele van invloed is op de scores van studenten. Op die manier kunnen we de belangrijkste demografische kenmerken identificeren die betrekking hebben op de testresultaten. Als we bijvoorbeeld kijken naar slechts één kenmerk - het percentage gezinnen in een bepaalde gemeenschap dat in armoede leeft - kunnen we bijna 58 procent van de score van de toets uitleggen in Engelse kunst van de achtste klas.

Onze meest recente studie onderzocht drie jaar testscores van groep zes tot acht in meer dan 300 New Jersey-scholen. We hebben gekeken naar het percentage gezinnen in de gemeenschap met een inkomen van meer dan US $ 200,000 per jaar, het percentage mensen in een gemeenschap in armoede en het percentage mensen in een gemeenschap met bachelors. We ontdekten dat we het percentage studenten konden voorspellen dat bekwaam of hoger was in 75 procent van de scholen die we hadden bemonsterd.

Een eerdere studie die zich richtte op testscores van de vijfde klas in New Jersey voorspelde de resultaten nauwkeurig voor 84 procent van de scholen over een periode van drie jaar.

Slimmere beoordelingen

Voor de duidelijkheid betekent dit niet dat geld bepaalt hoeveel studenten kunnen leren. Dat kan niet verder van de waarheid zijn. Onze resultaten tonen zelfs aan dat gestandaardiseerde tests niet echt meten hoeveel leerlingen leren, of hoe goed leraren onderwijzen, of hoe effectief schoolleiders hun scholen leiden. Dergelijke tests zijn botte instrumenten die zeer gevoelig zijn voor het meten van buitenschoolse factoren.

Hoewel sommige voorstanders van gestandaardiseerde beoordelingen beweren dat scores kunnen worden gebruikt om verbetering te meten, hebben we geconstateerd dat er gewoon te veel ruis is. Veranderingen in testscores van jaar tot jaar kunnen worden toegeschreven aan de normale groei gedurende het schooljaar, of de student een slechte dag had of zich ziek of moe voelde, computerstoringen of andere niet-verwante factoren.

Volgens de technische handleidingen die zijn gepubliceerd door de makers van gestandaardiseerde beoordelingen, is geen van de tests die momenteel worden gebruikt om de effectiviteit van de docent of de schoolbeheerder of de prestaties van studenten te beoordelen, gevalideerd voor dat gebruik. Geen van de PARCC-onderzoeken, bijvoorbeeld geleverd door PARCC, lost deze problemen rechtstreeks op. De tests zijn gewoon niet bedoeld om het leren te diagnosticeren. Het zijn eenvoudig apparaten monitoren, zoals blijkt uit hun technische rapporten.

Waar het op neerkomt is: Of je nu probeert om vaardigheid of groei te meten, gestandaardiseerde tests zijn niet het antwoord.

Hoewel onze resultaten in verschillende staten overtuigend waren, hebben we meer onderzoek op nationaal niveau nodig om te bepalen hoeveel testscores door niet-schoolgaande factoren worden beïnvloed.

Als deze gestandaardiseerde testresultaten met een hoge mate van nauwkeurigheid kunnen worden voorspeld door gemeenschaps- en gezinsfactoren, zou dit grote beleidsimplicaties hebben. Naar mijn mening suggereert het dat we de hele beleidsstichting die zulke testresultaten gebruikt, overboord gooien om belangrijke beslissingen te nemen over schoolpersoneel en studenten. Deze factoren liggen immers buiten de controle van studenten en schoolpersoneel.

Hoewel er ideologische meningsverschillen zijn over de voordelen van gestandaardiseerde testresultaten, is de wetenschap duidelijker geworden. De resultaten suggereren dat gestandaardiseerde testresultaten meer vertellen over de gemeenschap waarin een student woont dan het bedrag dat de student heeft geleerd of de academische, sociale en emotionele groei van de student tijdens een schooljaar.

Hoewel sommigen het misschien niet willen accepteren, na verloop van tijd, beoordelingen door leraren zijn betere indicatoren voor de prestaties van studenten dan gestandaardiseerde tests. GPA op middelbare school, dat is gebaseerd op klasbeoordelingen, is bijvoorbeeld een betere voorspeller van studentensucces in het eerste jaar van de universiteit dan de SAT.

The ConversationDeze verandering zou een lange weg kunnen bieden naar belangrijke informatie over effectief onderwijs, vergeleken met een testscore die weinig met de leraar te maken heeft.

Over de auteur

Christopher Tienken, Associate Professor of Education Leadership Management and Policy, Seton Hall University

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees de originele artikel.

Boeken van deze auteur

at InnerSelf Market en Amazon