Tak effekt (statistik)

Tak effekt vid datainsamling, när variansen i en beroende variabel inte mäts eller uppskattas över en viss nivå, är ett vanligt förekommande praktiskt problem vid datainsamling inom många vetenskapliga discipliner. En sådan effekt är ofta ett resultat av begränsningar i instrument för datainsamling. När en takteffekt uppstår vid datainsamling uppstår en gruppering av poäng på den övre nivån som rapporteras av ett instrument.

Begränsningar för svarsbiasRedigera

Svarsbias är vanligt förekommande i forskning som rör frågor som kan ha etiska grunder eller som generellt sett uppfattas ha negativa konnotationer. Deltagarna kan underlåta att svara på en åtgärd på ett lämpligt sätt baserat på om de tror att det korrekta svaret betraktas negativt. En befolkningsundersökning om livsstilsvariabler som påverkar hälsan kan innehålla en fråga om rökvanor. För att skydda sig mot risken att en respondent som är storrökare vägrar att ge ett korrekt svar om rökning, kan den högsta nivån av rökning som efterfrågas i undersökningsinstrumentet vara ”två paket om dagen eller mer”. Detta leder till en takteffekt i och med att personer som röker tre paket eller mer per dag inte särskiljs från personer som röker exakt två paket. En befolkningsundersökning om inkomster kan också ha en högsta svarsnivå på ”100 000 dollar per år eller mer”, i stället för att inkludera högre inkomstintervall, eftersom respondenterna kan vägra att svara överhuvudtaget om frågorna i undersökningen identifierar deras inkomst alltför specifikt. Även detta resulterar i en takteffekt, eftersom man inte skiljer personer som har en inkomst på 500 000 dollar per år eller mer från dem som har en inkomst på exakt 100 000 dollar per år. Svarsbiasens roll när det gäller att orsaka takteffekter framgår tydligt av exemplet med enkätrespondenter som tror att det önskvärda svaret är det högsta värde som kan rapporteras, vilket resulterar i en gruppering av datapunkter. Försöket att förhindra svarsbias, i fallet med undersökningen om rökvanor, leder till takteffekter genom åtgärdens grundläggande utformning.

Begränsningar av instrumentets räckviddEdit

Det område av data som kan samlas in av ett visst instrument kan begränsas av inneboende begränsningar i instrumentets utformning. Ofta innebär utformningen av ett visst instrument att man måste göra avvägningar mellan tak- och golveffekter. Om en beroende variabel som mäts på en nominell skala inte har svarskategorier som på lämpligt sätt täcker den övre delen av urvalets fördelning, måste svaret för maximalt värde inkludera alla värden över skalans slut. Detta kommer att resultera i en takteffekt på grund av att respondenterna grupperas i den enda maximala kategorin, vilket förhindrar en korrekt representation av avvikelsen bortom den punkten. Detta problem uppstår i många typer av undersökningar där man använder förutbestämda svar i form av parenteser. När många försökspersoner har poäng på en variabel vid den övre gränsen för vad ett instrument rapporterar, ger dataanalysen felaktig information eftersom en del av den faktiska variationen i data inte återspeglas i de poäng som erhålls från det instrumentet.

En takteffekt sägs inträffa när en stor andel av försökspersonerna i en undersökning har maximala poäng på den observerade variabeln. Detta gör det omöjligt att diskriminera mellan försökspersoner bland de som befinner sig i den övre delen av skalan. Till exempel kan ett examensarbete leda till att till exempel 50 % av studenterna får 100 % poäng. Även om ett sådant prov kan fungera som ett användbart tröskeltest, möjliggör det inte en rangordning av de bästa resultaten. Av denna anledning ingår ofta en undersökning av testresultaten med avseende på en eventuell takteffekt, och den omvända golveffekten, i valideringen av instrument som de som används för att mäta livskvalitet.

I ett sådant fall hindrar takteffekten instrumentet från att notera ett mätvärde eller en uppskattning som är högre än en viss gräns som inte är relaterad till det fenomen som observeras, utan snarare relaterad till instrumentets utformning. Ett grovt exempel skulle vara att mäta trädens höjd med en linjal som bara är 20 meter lång, om det är uppenbart på grundval av andra bevis att det finns träd som är mycket högre än 20 meter. Att använda 20-meterslinjalen som enda metod för att mäta träd skulle innebära ett tak för insamling av uppgifter om trädens höjd. Tak- och golveffekter begränsar båda räckvidden för de uppgifter som rapporteras av instrumentet, vilket minskar variabiliteten i de insamlade uppgifterna. Begränsad variabilitet i de insamlade uppgifterna om en variabel kan minska kraften i statistiken om korrelationer mellan den variabeln och en annan variabel.

HögskoleantagningstesterRedigera

I de olika länder som använder antagningstester som huvuddel eller viktig del för att avgöra om man är behörig att studera vid en högskola eller ett universitet, avser de insamlade uppgifterna de olika prestationsnivåerna hos de sökande på testerna. När ett antagningsprov för högskolor har en högsta möjliga poäng som kan uppnås utan perfekt prestation på provets innehåll har provets poängskala en takteffekt. Om testets innehåll är lätt för många testdeltagare kanske testet dessutom inte avspeglar de faktiska skillnaderna i prestationer (vilket skulle upptäckas med andra instrument) bland testdeltagare som befinner sig i den övre delen av testets prestationsintervall. Matematiktest som används för antagning till college i USA och liknande test som används för antagning till universitet i Storbritannien illustrerar båda fenomenen.

Kognitiv psykologiRedigera

I den kognitiva psykologin studeras mentala processer som problemlösning och memorering experimentellt genom att använda operationella definitioner som möjliggör tydliga mätningar. Ett vanligt mått av intresse är den tid det tar att reagera på ett givet stimulus. När man studerar denna variabel kan ett tak vara det lägsta möjliga talet (det minsta antalet millisekunder till ett svar), snarare än det högsta värdet, vilket är den vanliga tolkningen av ”tak”. Vid studier av responstid kan det förefalla som om ett tak hade uppstått i mätningarna på grund av en uppenbar gruppering kring en viss minsta tid (t.ex. den snabbaste tid som registrerats i ett experiment). Denna gruppering kan dock i själva verket utgöra en naturlig fysiologisk gräns för svarstiden, snarare än en artefakt av stoppklockans känslighet (vilket naturligtvis skulle vara en takteffekt). Ytterligare statistiska studier och vetenskapliga bedömningar kan avgöra om observationerna beror på ett tak eller om de är sanningen eller inte.

Validitet av instrumentbegränsningarRedigera

IQ-testning Redigera

En del författare om begåvningsundervisning skriver om att takteffekter i IQ-testning har negativa konsekvenser för individer. Dessa författare hävdar ibland att sådana tak leder till en systematisk underskattning av IQ hos intellektuellt begåvade personer. I det här fallet är det nödvändigt att noggrant skilja på två olika sätt som begreppet ”tak” används i skrifter om IQ-testning.

IQ-poäng kan skilja sig åt i viss utsträckning för samma individ på olika IQ-test (ålder 12-13 år). (Tabelluppgifter om IQ-poäng och pseudonymer för elever anpassade från beskrivningen av KABC-II-normeringsstudien som citeras i Kaufman 2009.)
Pupil	KABC-II	WISC-III	WJ-III
Asher	90	95	111
Brianna	125		110	105
Colin	100	93	101
Danica	116	127	118
Elpha	93	105	105	93
Fritz	106	105	105
Georgi	95	100	90
Hector	112	113	103
Imelda	104	96	97
Jose	101	99	86
Keoku	81	78	75
Leo	116	124	102

De tak som gäller för IQ-undertesterna åläggs genom att de har ett intervall av successivt svårare uppgifter. Ett IQ-test med ett brett utbud av successivt svårare frågor kommer att ha ett högre tak än ett med ett smalt utbud och få svåra frågor. Takeffekter resulterar i en oförmåga att för det första skilja mellan begåvade (oavsett om de är måttligt begåvade, djupt begåvade etc.) och för det andra resulterar det i en felaktig klassificering av vissa begåvade personer som över genomsnittet, men inte begåvade.

Förmodligen har ett IQ-test tre delprov: ordkunskap, aritmetik och bildanalogier. Poängen på vart och ett av delproven normaliseras (se standardpoäng) och adderas sedan för att ge ett sammansatt IQ-poäng. Anta nu att Joe får maximalt 20 poäng på det aritmetiska testet, men får 10 av 20 poäng på testerna för ordförråd och analogier. Är det rättvist att säga att Joes totala poäng på 20+10+10, eller 40, representerar hans totala förmåga? Svaret är nej, eftersom Joe uppnådde högsta möjliga poäng på 20 på aritmetikprovet. Om det aritmetiska testet hade innehållit fler, svårare uppgifter hade Joe kanske fått 30 poäng på det delprovet, vilket hade gett ett ”sant” resultat på 30+10+10+10 eller 50. Jämför Joes resultat med Jims, som fick 15+15+15+15 = 45, utan att stöta på några undertesttak. I den ursprungliga formuleringen av testet klarade Jim sig bättre än Joe (45 mot 40), medan det är Joe som faktiskt borde ha fått ett högre ”totalt” intelligensresultat än Jim (50 poäng för Joe mot 45 för Jim) med hjälp av ett omformulerat test som innehåller svårare aritmetiska uppgifter.

I skrifter om begåvningsutbildning tas två skäl upp för att anta att vissa IQ-poäng är en underskattning av testpersonens intelligens:

De tenderar att prestera alla delprov bättre än mindre begåvade personer;
De tenderar att prestera mycket bättre på vissa delprov än på andra, vilket ökar variabiliteten mellan delproven och chansen att man stöter på ett tak.

Statistisk analysRedigera

Takseffekter på mätningar äventyrar den vetenskapliga sanningen och förståelsen genom ett antal relaterade statistiska aberrationer.

För det första försämrar taken utredarnas förmåga att fastställa den centrala tendensen i data. När en takteffekt avser data som samlats in om en beroende variabel kan underlåtenhet att inse denna takteffekt ”leda till den felaktiga slutsatsen att den oberoende variabeln inte har någon effekt”. Av matematiska skäl som ligger utanför denna artikels räckvidd (se variansanalys) minskar denna hämmade varians känsligheten hos vetenskapliga experiment som är utformade för att avgöra om genomsnittet i en grupp skiljer sig signifikant från genomsnittet i en annan grupp. Till exempel kan en behandling som ges till en grupp ge en effekt, men effekten kan undgå att upptäckas eftersom medelvärdet för den behandlade gruppen inte kommer att se tillräckligt annorlunda ut jämfört med medelvärdet för den obehandlade gruppen.

Därmed är ”takteffekter ett komplex av frågor och deras undvikande en fråga om noggrann utvärdering av en rad frågor”.”

FörebyggandeRedigera

Då takteffekter förhindrar en korrekt tolkning av data är det viktigt att försöka förhindra att effekterna uppstår eller att använda förekomsten av effekterna för att justera det instrument och de förfaranden som användes. Forskare kan försöka förhindra att takteffekter uppstår med hjälp av ett antal metoder. Den första är att välja ett tidigare validerat mått genom att granska tidigare forskning. Om det inte finns några validerade mått kan pilotförsök genomföras med hjälp av de föreslagna metoderna. Pilottestning, eller genomförande av ett pilotexperiment, innebär att instrument och förfaranden testas i liten skala före det egentliga experimentet, vilket gör det möjligt att inse att justeringar bör göras för att få en så effektiv och korrekt datainsamling som möjligt. Om forskarna använder en utformning som inte tidigare har validerats kan en kombination av undersökningar, inklusive den ursprungligen föreslagna och en annan som stöds av tidigare litteratur, användas för att bedöma förekomsten av takteffekter. Om någon forskning, särskilt pilotstudien, visar på en takteffekt, bör ansträngningar göras för att justera instrumentet så att effekten kan mildras och informativ forskning kan genomföras.