Att mäta läsförståelse: utmaningar och fallgropar

I vårt samhälle är det få förmågor som är så viktiga som läsförståelse - att kunna ta till oss betydelsen av lästa texter. Läsförståelse är själva meningen med att läsa, och är en förutsättning för att kunna lära sig genom det skrivna ordet. Det är de fallande läsförståelseresultaten hos svenska 15-åringar som är en av de saker som har lyfts fram från den senaset PISA-undersökningen (2012), och det finns också de som menar att de lägre resultaten i PISAs naturvetenskapliga del kan bero på brister i läsförståelse — om man inte förstår krångligt formulerade frågor, så svarar man heller inte rätt, även om man har kunskaperna.

Men det var inte PISA-resultaten som jag främst tänkte skriva om idag, utan jag tänkte börja med en serie om läsförståelseforskning här på forskningsbloggen, eftersom detta är så centralt för alla elever, inte minst de som har läs- skriv- eller språksvårigheter.

Mitt tidigare inlägg om läsförståelse, klassrumsbaserad behandling och “the simple view of reading” kan fungera som en introduktion, men för att påminna er om “the simple view" så bör läsförståelse ses som en produkt av avkodningsförmåga och språklig (hör)förståelse.

Förenklat kan man säga att en elev kan ha svårt att förstå det den läser antingen för att avkodningen/den tekniska läsningen är svag (som vid dyslexi), eller för att språkförståelsen är svag (på grund av språkstörning eller t.ex. svagt ordförråd), eller på grund av båda anledningarna kombinerat.

Men självklart beror också läsförståelse på själva texten och förståelseuppgiften, och det är det som jag ville diskutera idag utifrån aktuell forskning.
 


Hur mäter vi läsförståelse och identifierar de elever som har läsförståelsesvårigheter?

Forskarna Keenan och Meenan (2014) ville jämföra fyra olika amerikanska standardiserade tester av läsförståelse och svara på (bland annat) följande frågor:

  1. Spelar det någon roll vilket test man väljer om man vill identifiera elever med läsförståelsesvårigheter?

  2. Är det någon skillnad i mellan yngre och äldre elever?

  3. Skiljer det sig mellan tester hur mycket avkodningsförmåga och arbetsminne inverkar på resultaten?

Även om de specifika tester som de utvärderade inte finns på svenska så tror jag att deras resultat och diskussion kan appliceras på svenska förhållanden och de svenska tester som används i både skolan och av logopeder.

 

LäsförståelseTESTER SOM utvärderades

 

GORT-3

Eleven läser kortare stycken faktatext och berättande text högt (85-150 ord) och svarar sedan muntligt på flervalsalternativfrågor som testledaren läser upp.

 

QRI-3

Eleven läser längre stycken faktatext och berättande text högt (250-785 ord) och förståelse mäts genom återberättande och muntliga svar på frågor (ej flervalsalternativ).

 

PIAT

Eleven läser en mening tyst för sig själv, meningen tas bort, och eleven får den bild av fyra som passar bäst till meningen.

 

WJPC-3

Eleven läser korta stycken (1-2 meningar) och ska fylla i ett ord som fattas (lucktest) för att visa att hen har förstått.

 

METOD

995 elever ingick i studien. Medelåldern var 11.7 år. Alla elever fick alla läsförståelsetester, och även avkodningstester och ett arbetsminnestest.

Forskarna tittade sedan på de 10% av eleverna som fick lägst resultat på varje läsförståelsetest och om det var samma elever som fick låga resultat i alla läsförståelsetester. De tittade både på hela gruppen och för yngre elever (medelålder 9.32 år) och äldre barn (medelålder 13.78 år) för att se om det var några åldersskillnader. De tittade också på hur stor del av variationen i läsförståelsetestresultat som kunde förklaras med avkodningsförmåga och arbetsminne för varje test separat.

 

RESULTAT

ENDAST 20 av 995 ELEVEr(!) FICK LÅGA RESULTAT PÅ ALLA FYRA TESTER

Det genomsnittliga överlappningen mellan test var 43% - med andra ord så var chansen mindre än hälften att en elev som identifierades med svag läsförståelse av ett test, också identifierades av ett annat test.

Detta tyder också på att testen som utvärderades hade väldigt olika “krav” och att de mäter olika aspekter av läsförståelse.

De två tysta läsförståelsetesterna (PIAT och WJPC-3) gav mest lika resultat, och testet med upplästa flervalsfrågor (GORT-3) var det som skiljde sig mest från de andra testerna.
 

YNGRE ELEVER preseterade mer lika på de olika testerna än ÄLDRE ELEVER

Forskarna drog slutsatsen att detta beror på att yngre elever är mer beroende av sin avkodningsförmåga, och att alla ingående tester kräver att man kan avkoda. Ett undantag var testet med upplästa flervalsfrågor (GORT-3) där avkodningsförmågan inte verkade spela så stor roll. En tidigare studie visade att det som spelade störst roll för resultaten i GORT-3 var elevernas bakgrundskunskap och deras förmåga till verbalt resonemang - det var alltså möjligt att svara på frågorna även om man inte läst texterna överhuvudtaget(!) (Keenan & Betjemann, 2006). GORT-testet har nu reviderats (efter att dessa studier publicerades), och i den senaste versionen är det frågor utan svarsalternativ istället för flervalsfrågor.
 

AVKODNING SPELADE STÖRRE ROLL FÖR RESULTATEN I KORTARE TEXTER ÄN FÖR LÄNGRE TEXTER

Forskarna förklarar detta med att i längre texter har eleverna mer sammanhang att luta sig mot, och eleven kan då kompensera för eventuella avkodningsfel.

 

ARBETSMINNE SPELADE STÖRRE ROLL FÖR RESULTATEN I DE KORTARE TEXTERNA

Detta tyckte forskarna var något förvånande, men samtidigt så var själva förståelseuppgifterna i de kortare texterna i sig mer arbetsminneskrävande: i PIAT så måste eleven hålla en mening i minnet för att kunna välja rätt bild, och i WJPC-3 måste eleven ibland hålla två meningar i huvudet för att kunna välja rätt ord i luck-testet (om luckan är precis i början av stycket). För de längre texterna handlar det troligtvis mer om att skapa sig en representation av det som ska förstås, snarare än att hålla specifika detaljer i minnet.
 

VARFÖR ÄR DETTA INTRESSANT?

Det Keenan och Meenan (2014) visade var att bland 1000 elever så var det mycket få som konsekvent identifierades som svaga i läsförståelse när fyra olika läsförståelsetester användes. Alla tester som ingick är standardiserade, har godkänd validitet och reliabilitet och används i både skola, klinik och forskning i USA. Trots detta så visade dessa resultat att vilket test man väljer spelar stor roll för vilka elever som identifieras med läsförståelsesvårigheter.

Beroende på hur läsförståelsetestet är upplagt så inverkar olika förmågor olika mycket på testresultaten. Resultaten kan varierar med texternas struktur och svårighetsgrad, men lika mycket på hur eleverna visar sin förståelse (flerval, lucktest, öppna frågor, muntliga eller skriftliga svar), och vilka bakgrundskunskaper och förmåga till verbalt resonemang eleven har.

Något som jag saknade i denna studie är att se hur stor del av variationen i de olika testerna som förklaras av språklig förmåga (t.ex. ordförråd, eller grammatisk hör(förståelse). Men jag tycker ändå att resultaten ger viktig information både för lärare och logopeder. De visar att läsförståelse måste testas med fler uppgifter än en, och att beroende på vilken typ av läsförståelseuppgift man ger så belastar det olika förmågor hos eleven.

Det visar också att det troligtvis är viktigare att testa förutsättningarna för läsförståelse (där både avkodning och språkförståelse ingår), än att förlita sig på läsförståelsetester, och detta är självklara delar i t.ex. en logopedisk läs- och skrivutredning. Standardiserade tester av läsförståelse ger en siffra på “läsförståelse”, men  ger i sig ingen ledtråd till VARFÖR eleven har svag läsförståelse. Och om vi inte vet varför eleven har svårt att förstå, blir det också svårt att hjälpa! Mer om detta i kommande inlägg.

Ha en fin vecka alla!

 

Referenser

Keenan, J. M., & Meenan, C. E. (2014). Test differences in diagnosing reading comprehension deficits. Journal of Learning Disabilities, 47(2), 125-135.

Keenan, J. M., & Betjemann, R. S. (2006). Comprehending the Gray Oral Reading Test without reading it: Why comprehension tests should not include passage-independent items. Scientific Studies of Reading, 10(4), 363-380.