Hvordan Dagens Standardiserte Tester Får Gjort

Etter at politikk og religion, er det få saker som er så omstridt som standardiserte tester. Meninger kjøre gamut. Til å begynne med, standardisert testing forvirrer våre skoler og bidrar til å viske ut forskjellene mellom elevene. For andre, er de fortsatt den beste måten å sammenligne studenter objektivt og hold skoler til ansvar.

Uansett hva dine tanker, det er ingen tvil om at studentene er å ta masse tester. For to år siden, AMERIKANSKE studenter ble tatt om åtte tester i året.

Forutsigbart, en stor bedrift har dukket opp rundt testing. Blant de som gjorde det til et levebrød veiledere, utgivere som Pearson og Scholastic og skrivere. Så er det psychometricians—math-lærde som design tester og lage komplekse algoritmer som prøver å gjøre dem virkelig til alle studenter. Eller med andre ord, «Hvordan gjør vi sammenligner elevene som tar ulike tester som om de hadde tatt den samme testen?»spør Mark Moulton.

Moulton har jobbet i feltet for ca 15 år med et lite, familiedrevet firma som heter Pedagogiske Data-Systemer, som gjør eksamener for lokale distrikter og high stakes tester for staten California. Han har nylig snakket med oss om testing bias, holder psychometricians ansvarlig for eksamener de skaper og om fremtiden innovasjon for et felt som fortsatt er dominert av matematikk, språk og multiple choice spørsmål.

Hva du vil er en test der elementer på det ikke spiller favoritter.
EdSurge: Hva kan gjøre en test urettferdig?

Mark Moulton: Her at hele spørsmålet er, hva virkelig betyr? Å få en lav score på en test betyr ikke at det er urettferdig. Eller selv om en etnisk gruppe som helhet fikk en lavere score enn en annen etnisk gruppe, det betyr ikke at testen var urettferdig. Hva du vil er en test der elementer på det ikke spiller favoritter. De teste én egenskap, og en egenskap, som er den samme for alle.

Hvis jeg gir en matematisk test og test inkluderer en haug av word-problemer—og det viser seg at en tredjedel av min test takere som ikke vet engelsk—så i praksis, for disse ord problemer, jeg er testing sin engelsk evne, ikke sine matematiske evner. Det er en urettferdig test.

Målet er å rydde opp test på en slik måte at befolkningen som du sikter til er kommer til å bli testet på det samme, og ingenting annet. Det er målet. Selvfølgelig, det er en ideell, noe som er aldri nådd helt.

Hvordan gjør prosessen med stripping ut bias arbeid?

OK, si du designe en test for staten California. Du velger din fagområde, la oss si det er språk, og du har et sett av standarder, som de Felles allmenne standarder. Dette er utsagn om hva vi ønsker å finne ut om våre studenter. Det angir hva som gode språkferdigheter betyr.

Da staten hender av en leverandør som skriver en test. Leverandøren forsøker å skrive elementer som svar til disse standardene. Så skriver de en haug med tester elementer eller spørsmål av ulike slag.

Etterpå kjører du den av et panel for å se om det er noen påviselige bias bare ved å lese spørsmål. Et spørsmål, hvor gutter er sannsynlig å vite svaret, men jentene er ikke, for eksempel, eller hvor Latinamerikanere er sannsynlig å vite svaret, men Asiater er ikke.

Så gir du en pilottest. Her det begynner å gå inn i en psykometriske modus der du får noen test data tilbake, og deretter gjør du en psykometriske analyser og se etter det som er kalt «differensial elementet fungerer.»Psykometriske analyser beregner vanskelighetsgrad for hvert spørsmål. Differensial elementet fungerer ser ut for å se om en gitt test spørsmål har en annen vanskelighet for en gruppe av mennesker over en annen gruppe.

Hvis du finner at spørsmålet ditt på skateboarding er en som gutter finner å være et enkelt spørsmål, men jenter finner å være et vanskelig spørsmål som vil dukke opp som statistikk. Differensial elementet fungerer vil flagge at spørsmål som problematisk.