Stropní efekt (statistika)

Stropní efekt při sběru dat, kdy rozptyl závislé proměnné není měřen nebo odhadován nad určitou úroveň, je často se vyskytujícím praktickým problémem při sběru dat v mnoha vědních oborech. Takový efekt je často důsledkem omezení nástrojů pro sběr dat. Když se při sběru dat objeví efekt stropu, dochází ke shlukování výsledků na horní úrovni vykazované nástrojem.

Omezení zkreslení odpovědíEdit

Zkreslení odpovědí se běžně vyskytuje ve výzkumu týkajícím se otázek, které mohou mít etický základ nebo jsou obecně vnímány jako otázky s negativní konotací. Účastníci mohou neodpovědět na opatření odpovídajícím způsobem na základě toho, zda se domnívají, že přesná odpověď je vnímána negativně. Populační průzkum týkající se proměnných životního stylu ovlivňujících zdravotní výsledky může zahrnovat otázku týkající se kuřáckých návyků. Aby se předešlo možnosti, že respondent, který je silným kuřákem, odmítne uvést přesnou odpověď o kouření, může být nejvyšší míra kouření, na kterou se dotazuje nástroj průzkumu, „dvě krabičky denně nebo více“. To vede ke stropnímu efektu, protože osoby, které kouří tři a více krabiček denně, nejsou odlišeny od osob, které kouří přesně dvě krabičky. Populační průzkum o příjmech by podobně mohl mít nejvyšší úroveň odpovědi „100 000 USD ročně nebo více“, místo aby zahrnoval vyšší příjmová rozpětí, protože respondenti by mohli odmítnout vůbec odpovědět, pokud by otázky průzkumu příliš konkrétně identifikovaly jejich příjem. I to vede ke stropovému efektu, neboť se nerozlišují osoby, které mají příjem 500 000 USD ročně nebo vyšší, od těch, jejichž příjem je přesně 100 000 USD ročně. Úloha zkreslení odpovědí při vzniku stropního efektu je jasně patrná na příkladu respondentů průzkumu, kteří se domnívají, že žádoucí odpověď je maximální vykazovaná hodnota, což vede ke shlukování datových bodů. Snaha zabránit zkreslení odpovědí vede v případě průzkumu kuřáckých návyků ke stropovým efektům prostřednictvím základní konstrukce měření.

Omezení rozsahu nástrojeEdit

Rozsah údajů, které lze shromáždit určitým nástrojem, může být omezen inherentními limity v konstrukci nástroje. Konstrukce konkrétního přístroje často zahrnuje kompromisy mezi stropními a spodními efekty. Pokud závislá proměnná měřená na nominální škále nemá kategorie odpovědí, které by vhodně pokrývaly horní konec rozdělení vzorku, bude muset odpověď na maximální hodnotu zahrnovat všechny hodnoty nad koncem škály. To bude mít za následek stropní efekt v důsledku seskupení respondentů do jediné maximální kategorie, což zabrání přesnému zobrazení odchylky za tímto bodem. Tento problém se vyskytuje u mnoha typů průzkumů, které používají předem stanovené odpovědi ve stylu závorek. Pokud má mnoho subjektů skóre u proměnné na horní hranici toho, co nástroj uvádí, analýza dat poskytuje nepřesné informace, protože část skutečné odchylky v datech se neodráží ve skórech získaných z daného nástroje.

O stropním efektu se hovoří tehdy, když vysoký podíl subjektů ve studii má maximální skóre u sledované proměnné. To znemožňuje diskriminaci mezi subjekty na horní hranici škály. Například u zkouškové práce může dojít k tomu, že řekněme 50 % studentů získá 100 % bodů. Taková písemná práce sice může sloužit jako užitečný prahový test, ale neumožňuje sestavit žebříček nejlepších výsledků. Z tohoto důvodu je zkoumání výsledků testů z hlediska možného stropního efektu a opačného dolního efektu často zabudováno do validace nástrojů, jako jsou nástroje používané pro měření kvality života.

V takovém případě stropní efekt brání nástroji zaznamenat měření nebo odhad vyšší než určitou hranici, která nesouvisí se sledovaným jevem, ale spíše s konstrukcí nástroje. Hrubým příkladem může být měření výšky stromů pravítkem dlouhým pouze 20 metrů, pokud je na základě jiných důkazů zřejmé, že existují stromy mnohem vyšší než 20 metrů. Použití dvacetimetrového pravítka jako jediného prostředku k měření stromů by stanovilo strop pro shromažďování údajů o výšce stromů. Efekt stropu i efekt podlahy omezují rozsah údajů vykazovaných přístrojem a snižují variabilitu shromážděných údajů. Omezená variabilita shromážděných údajů o jedné proměnné může snížit vypovídací schopnost statistik o korelacích mezi touto proměnnou a jinou proměnnou.

Přijímací testy na vysoké školyRedakce

V různých zemích, které používají přijímací testy jako hlavní nebo důležitý prvek pro určení způsobilosti ke studiu na vysoké škole nebo univerzitě, se shromážděné údaje týkají rozdílné úrovně výkonů uchazečů v testech. Pokud má přijímací test na vysokou školu maximální možný počet bodů, kterého lze dosáhnout bez perfektního zvládnutí obsahu testových položek, má bodová škála testu efekt stropu. Pokud je navíc obsah testu pro mnoho uchazečů snadný, nemusí test odrážet skutečné rozdíly ve výkonu (jak by bylo možné zjistit u jiných nástrojů) mezi uchazeči na horní hranici výkonnostní škály testu. Matematické testy používané pro přijímání na vysoké školy ve Spojených státech a podobné testy používané pro přijímání na univerzity ve Velké Británii ilustrují oba jevy.

Kognitivní psychologieEdit

V kognitivní psychologii se mentální procesy, jako je řešení problémů a zapamatování, studují experimentálně pomocí operačních definic, které umožňují jasné měření. Běžným měřením, které je předmětem zájmu, je doba potřebná k reakci na daný podnět. Při studiu této veličiny může být stropem nejnižší možné číslo (nejmenší počet milisekund k reakci), nikoli nejvyšší hodnota, jak je obvyklý výklad pojmu „strop“. Při studiu doby odezvy se může zdát, že při měření došlo ke stropu v důsledku zjevného shlukování kolem určité minimální doby (například nejrychlejšího času zaznamenaného v experimentu). Toto shlukování by však ve skutečnosti mohlo představovat přirozený fyziologický limit reakční doby, a nikoli artefakt citlivosti stopek (což by samozřejmě byl efekt stropu). Další statistické studie a vědecký úsudek mohou vyřešit, zda jsou tato pozorování způsobena stropem, nebo zda jsou pravdivá.

Platnost přístrojových omezeníEdit

Testování IQ Edit

Někteří autoři zabývající se vzděláváním nadaných píší o tom, že stropní efekt v testování IQ má negativní důsledky pro jedince. Tito autoři někdy tvrdí, že takové stropy způsobují systematické podhodnocování IQ intelektově nadaných osob. V tomto případě je třeba pečlivě rozlišovat dva různé způsoby, jak se termín „strop“ v textech o testování IQ používá.

Skóre IQ se může u téhož jedince v různých testech IQ (ve věku 12-13 let) do určité míry lišit. (Údaje z tabulky skóre IQ a pseudonymy žáků převzaty z popisu normovací studie KABC-II citované v Kaufman 2009.)
Žák	KABC-II	WISC-III	WJ-III
Asher	90	95	111
Brianna	125	110	105
Colin	100	93	101
Danica	116	127	118
Elfa	93	105	93
Fritz	106	105	105
Georgi	95	100	90
Hector	112	113	103
Imelda	104	96	97
Jose	101	99	86
Keoku	81	78	75
Leo	116	124	102

Stropy subtestů IQ jsou dány jejich rozsahy postupně obtížnějších položek. Test IQ s širokým rozsahem postupně obtížnějších otázek bude mít vyšší strop než test s úzkým rozsahem a malým počtem obtížných položek. Stropní efekt má za následek jednak neschopnost rozlišit nadané (ať už středně nadané, hluboce nadané atd.), jednak vede k chybné klasifikaci některých nadaných lidí jako nadprůměrně nadaných, ale ne nadaných.

Předpokládejme, že test IQ má tři subtesty: slovní zásobu, aritmetiku a obrázkové analogie. Výsledky jednotlivých subtestů jsou normalizovány (viz standardní skóre) a poté se sečtou, aby vzniklo souhrnné skóre IQ. Nyní předpokládejme, že Joe dosáhne v aritmetickém testu maximálního skóre 20 bodů, ale v testech slovní zásoby a analogií získá 10 bodů z 20 možných. Lze říci, že Joeovo celkové skóre 20+10+10, tedy 40, představuje jeho celkové schopnosti? Odpověď zní ne, protože Joe dosáhl v aritmetickém testu maximálního možného skóre 20 bodů. Kdyby aritmetický test obsahoval další, obtížnější položky, mohl Joe v tomto subtestu získat 30 bodů, což by znamenalo „skutečné“ skóre 30+10+10 neboli 50 bodů. Porovnejte Joeův výkon s výkonem Jima, který získal 15+15+15 = 45 bodů, aniž by narazil na nějaký subtestový strop. V původní formulaci testu si Jim vedl lépe než Joe (45 versus 40), zatímco při použití přeformulovaného testu, který zahrnuje obtížnější aritmetické položky, by měl Joe ve skutečnosti získat vyšší „celkové“ skóre inteligence než Jim (skóre 50 pro Joea versus 45 pro Jima).

Písemnosti o vzdělávání nadaných přinášejí dva důvody, proč předpokládat, že některé výsledky IQ podhodnocují inteligenci testovaného:

mají tendenci provádět všechny subtesty lépe než méně nadaní lidé;
mají tendenci provádět některé subtesty mnohem lépe než jiné, což zvyšuje variabilitu mezi subtesty a šanci, že se narazí na strop.

Statistická analýzaEdit

Vliv stropu na měření ohrožuje vědeckou pravdu a porozumění prostřednictvím řady souvisejících statistických odchylek.

Za prvé, stropy zhoršují schopnost vyšetřovatelů určit centrální tendenci dat. Pokud se stropní efekt týká údajů shromážděných o závislé proměnné, může nerozpoznání tohoto stropního efektu „vést k mylnému závěru, že nezávislá proměnná nemá žádný vliv“. Z matematických důvodů, které přesahují rámec tohoto článku (viz analýza rozptylu), tento potlačený rozptyl snižuje citlivost vědeckých experimentů, jejichž cílem je určit, zda se průměr jedné skupiny významně liší od průměru jiné skupiny. Například léčba podaná jedné skupině může vyvolat účinek, ale tento účinek může uniknout odhalení, protože průměr léčené skupiny nebude vypadat dostatečně odlišně od průměru neléčené skupiny.

Takže „stropní efekty jsou komplexem záležitostí a jejich zamezení záležitostí pečlivého vyhodnocení řady otázek.“

PrevenceEdit

Protože stropní efekty brání přesné interpretaci dat, je důležité pokusit se zabránit výskytu těchto efektů nebo využít jejich přítomnosti k úpravě použitého nástroje a postupů. Výzkumníci se mohou pokusit zabránit výskytu stropních efektů pomocí řady metod. První z nich je výběr dříve ověřeného měřítka na základě přezkoumání minulých výzkumů. Pokud žádná validovaná opatření neexistují, lze provést pilotní testování pomocí navržených metod. Pilotní testování neboli provedení pilotního experimentu zahrnuje vyzkoušení nástrojů a postupů v malém měřítku před vlastním experimentem, což umožňuje rozpoznat, že je třeba provést úpravy pro co nejefektivnější a nejpřesnější sběr dat. Pokud výzkumní pracovníci používají plán, který nebyl dříve ověřen, lze k posouzení přítomnosti stropních efektů použít kombinaci průzkumů, zahrnující ten původně navržený a jiný podpořený dosavadní literaturou. Pokud některý z výzkumů, zejména pilotní studie, vykazuje stropní efekt, mělo by být vyvinuto úsilí o úpravu nástroje tak, aby bylo možné tento efekt zmírnit a provést informativní výzkum