Efekt sufitowy (statystyka)

Efekt sufitowy w zbieraniu danych, kiedy wariancja zmiennej zależnej nie jest mierzona lub szacowana powyżej pewnego poziomu, jest powszechnie spotykanym problemem praktycznym w zbieraniu danych w wielu dyscyplinach naukowych. Efekt taki jest często wynikiem ograniczeń w narzędziach do zbierania danych. Kiedy efekt sufitowy występuje w zbieraniu danych, występuje grupowanie wyników na górnym poziomie raportowanym przez instrument.

Ograniczenia związane z tendencyjnością odpowiedziEdit

Tendencyjność odpowiedzi występuje powszechnie w badaniach dotyczących kwestii, które mogą mieć podstawy etyczne lub są ogólnie postrzegane jako mające negatywne konotacje. Uczestnicy mogą nie udzielić właściwej odpowiedzi w oparciu o to, czy ich zdaniem właściwa odpowiedź jest postrzegana negatywnie. W badaniu populacyjnym dotyczącym zmiennych stylu życia wpływających na wyniki zdrowotne może pojawić się pytanie o nałóg palenia. Aby zabezpieczyć się przed możliwością, że respondent, który jest nałogowym palaczem, może odmówić udzielenia dokładnej odpowiedzi na temat palenia, najwyższy poziom palenia, o jaki pytano w instrumencie ankietowym, może wynosić „dwie paczki dziennie lub więcej”. Powoduje to efekt pułapu, ponieważ osoby, które palą trzy paczki lub więcej dziennie nie są odróżniane od osób, które palą dokładnie dwie paczki. Ankieta dotycząca dochodów może mieć najwyższy poziom odpowiedzi „100 000 dolarów rocznie lub więcej”, zamiast uwzględniać wyższe przedziały dochodów, ponieważ respondenci mogą w ogóle odmówić odpowiedzi, jeśli pytania ankietowe określą ich dochody zbyt szczegółowo. To również powoduje efekt pułapu, nie rozróżniając osób, które mają dochód 500 000 dolarów rocznie lub wyższy od tych, których dochód wynosi dokładnie 100 000 dolarów rocznie. | W którym roku [ubiegał się Pan/ubiegała się Pani] o rentę inwalidzką z tytułu niezdolności do pracy lub o dodatek opiekuńczy?

Ograniczenia zakresu instrumentuEdit

Zakres danych, które mogą być zebrane przez konkretny instrument może być ograniczony przez nieodłączne ograniczenia w projekcie instrumentu. Często projekt danego instrumentu obejmuje kompromis pomiędzy efektami sufitowymi i efektami dolnymi. Jeśli zmienna zależna mierzona na skali nominalnej nie ma kategorii odpowiedzi, które odpowiednio pokrywają górny koniec dystrybucji próby, maksymalna wartość odpowiedzi będzie musiała zawierać wszystkie wartości powyżej końca skali. To spowoduje efekt pułapu z powodu zgrupowania respondentów w jednej maksymalnej kategorii, co uniemożliwia dokładną reprezentację odchylenia poza tym punktem. Ten problem występuje w wielu typach ankiet, które używają wcześniej ustalonych odpowiedzi w formie nawiasów.

Efekt sufitowy występuje wtedy, gdy duża część badanych ma maksymalne wyniki w obserwowanej zmiennej. Uniemożliwia to dyskryminację wśród badanych osób z górnego końca skali. Przykładowo, praca egzaminacyjna może sprawić, że np. 50% studentów uzyska 100% punktów. Taka praca może służyć jako użyteczny test progowy, ale nie pozwala na uszeregowanie osób uzyskujących najwyższe wyniki. Z tego powodu, badanie wyników testu pod kątem możliwego efektu pułapu i odwrotnie, efektu podłogi, jest często wbudowane w walidację instrumentów, takich jak te używane do pomiaru jakości życia.

W takim przypadku, efekt pułapu powstrzymuje instrument od odnotowania pomiaru lub oszacowania wyższego niż pewna granica nie związana z obserwowanym zjawiskiem, ale raczej związana z konstrukcją instrumentu. Prosty przykład to mierzenie wysokości drzew za pomocą linijki o długości tylko 20 metrów, jeśli jest oczywiste na podstawie innych dowodów, że istnieją drzewa znacznie wyższe niż 20 metrów. Używanie 20-metrowej linijki jako jedynego sposobu mierzenia drzew narzuciłoby pułap gromadzenia danych o wysokości drzew. Zarówno efekt sufitu, jak i efekt podłogi ograniczają zakres danych podawanych przez instrument, zmniejszając zmienność zgromadzonych danych. Ograniczona zmienność w danych zebranych na temat jednej zmiennej może zmniejszyć moc statystyk dotyczących korelacji między tą zmienną a inną zmienną.

Testy wstępne do szkół wyższychEdit

W różnych krajach, które używają testów wstępnych jako głównego elementu lub ważnego elementu do określenia kwalifikowalności do college’u lub studiów uniwersyteckich, zebrane dane odnoszą się do różnych poziomów wydajności wnioskodawców na testach. Jeśli test wstępny na studia ma maksymalny możliwy wynik, który można osiągnąć bez perfekcyjnego wykonania poszczególnych elementów testu, skala punktacji testu ma efekt pułapu. Ponadto, jeśli treść testu jest łatwa dla wielu testujących, test może nie odzwierciedlać rzeczywistych różnic w wynikach (co można by wykryć za pomocą innych narzędzi) wśród testujących z górnej granicy zakresu wyników testu. Testy matematyczne stosowane przy przyjmowaniu do college’u w Stanach Zjednoczonych i podobne testy stosowane przy przyjmowaniu na uniwersytet w Wielkiej Brytanii ilustrują oba zjawiska.

Psychologia poznawczaEdit

W psychologii poznawczej procesy umysłowe, takie jak rozwiązywanie problemów i zapamiętywanie, są badane eksperymentalnie przy użyciu definicji operacyjnych, które pozwalają na jasne pomiary. Częstą miarą zainteresowania jest czas potrzebny na zareagowanie na dany bodziec. W badaniu tej zmiennej, pułapem może być najniższa możliwa liczba (najmniej milisekund do odpowiedzi), a nie najwyższa wartość, jak zwykle interpretuje się pojęcie „pułapu”. W badaniach czasu reakcji, może się wydawać, że pułap wystąpił w pomiarach z powodu pozornego skupienia wokół jakiegoś minimalnego czasu (takiego jak najszybszy czas zarejestrowany w eksperymencie). Jednakże, to grupowanie może w rzeczywistości reprezentować naturalne fizjologiczne ograniczenie czasu reakcji, a nie artefakt czułości stopera (co oczywiście byłoby efektem pułapu). Dalsze badania statystyczne i osąd naukowy mogą rozstrzygnąć, czy obserwacje są spowodowane pułapem, czy też są prawdą w tej sprawie.

Ważność ograniczeń instrumentuEdycja

Testy IQ Edycja

Niektórzy autorzy zajmujący się edukacją uzdolnionych piszą o efektach pułapu w testach IQ mających negatywne konsekwencje dla jednostek. Autorzy ci czasami twierdzą, że takie pułapy powodują systematyczne niedoszacowanie IQ osób uzdolnionych intelektualnie. W tym przypadku konieczne jest dokładne rozróżnienie dwóch różnych sposobów, w jakie termin „pułap” jest używany w pismach dotyczących testów IQ.

.

.

.

Wyniki IQ mogą się różnić do pewnego stopnia dla tej samej osoby w różnych testach IQ (wiek 12-13 lat). (Dane z tabeli wyników IQ i pseudonimy uczniów zaadaptowane z opisu badania normalizacyjnego KABC-II cytowanego w Kaufman 2009.)
Uczeń KABC-II WISC-III WJ-.III
Asher 90 95 111
Brianna 125 110 105
Colin 100 93 101
Danica 116 127 118
Elfa 93 105 93
Fritz 106 105 105
Georgi 95 100 90
Hector 112 113 103
Imelda 104 96 97
Jose 101 99 86
Keoku 81 78 75
Leo 116 124 102

Pułapy podtestów IQ są narzucone przez ich zakresy stopniowo trudniejszych pozycji. Test IQ z szerokim zakresem stopniowo coraz trudniejszych pytań będzie miał wyższy pułap niż ten z wąskim zakresem i niewielką liczbą trudnych pytań. Efekty sufitowe skutkują niezdolnością, po pierwsze, do rozróżnienia między uzdolnionymi (czy umiarkowanie uzdolnionymi, głęboko uzdolnionymi, itd.), a po drugie, skutkują błędną klasyfikacją niektórych uzdolnionych osób jako ponadprzeciętnie uzdolnionych, ale nie uzdolnionych.

Załóżmy, że test IQ ma trzy podtesty: słownictwo, arytmetyka i analogie obrazkowe. Wyniki w każdym z podtestów są znormalizowane (patrz wynik standardowy), a następnie dodane razem, aby otrzymać całkowity wynik IQ. Załóżmy, że Joe uzyskał maksymalny wynik 20 punktów w teście arytmetycznym, ale uzyskał 10 punktów na 20 w teście słownictwa i analogii. Czy można powiedzieć, że całkowity wynik Joego 20+10+10, czyli 40, reprezentuje jego całkowite zdolności? Odpowiedź brzmi: nie, ponieważ Joe osiągnął maksymalny możliwy wynik 20 punktów na teście arytmetycznym. Gdyby test arytmetyczny zawierał dodatkowe, trudniejsze elementy, Joe mógłby uzyskać 30 punktów z tego podtestu, co dałoby „prawdziwy” wynik 30+10+10 lub 50. Porównaj wynik Joe z wynikiem Jima, który uzyskał 15+15+15 = 45, nie napotykając na żadne pułapy w podtestach. W oryginalnej formule testu, Jim wypadł lepiej niż Joe (45 vs. 40), podczas gdy to Joe powinien uzyskać wyższy wynik „całkowitej” inteligencji niż Jim (wynik 50 dla Joe vs. 45 dla Jima) używając przeformułowanego testu, który zawiera trudniejsze pozycje arytmetyczne.

Pisma dotyczące edukacji uzdolnionych podają dwa powody, dla których można przypuszczać, że niektóre wyniki IQ są zaniżone w stosunku do inteligencji osoby testowanej:

  1. osoby te mają tendencję do wykonywania wszystkich podtestów lepiej niż osoby mniej utalentowane;
  2. osoby te mają tendencję do wykonywania niektórych podtestów znacznie lepiej niż innych, podnosząc zmienność międzypodtestową i szansę, że napotkają pułap.

Analiza statystycznaEdit

Efekty pułapu w pomiarach zagrażają prawdzie naukowej i zrozumieniu poprzez szereg powiązanych aberracji statystycznych.

Po pierwsze, pułapy upośledzają zdolność badaczy do określenia tendencji centralnej danych. Kiedy efekt pułapu odnosi się do danych zebranych na temat zmiennej zależnej, brak rozpoznania tego efektu pułapu może „prowadzić do błędnego wniosku, że zmienna niezależna nie ma żadnego wpływu.” Z powodów matematycznych wykraczających poza zakres tego artykułu (patrz analiza wariancji), ta zahamowana wariancja zmniejsza czułość eksperymentów naukowych zaprojektowanych w celu określenia, czy średnia jednej grupy różni się znacząco od średniej innej grupy. Na przykład leczenie podane jednej grupie może wywołać efekt, ale efekt może umknąć wykryciu, ponieważ średnia grupy leczonej nie będzie wyglądać wystarczająco różnie od średniej grupy nieleczonej.

Tak więc „efekty sufitowe są kompleksem spraw, a ich unikanie kwestią starannej oceny szeregu zagadnień.”

ZapobieganieEdit

Ponieważ efekty sufitowe uniemożliwiają dokładną interpretację danych, ważne jest, aby próbować zapobiegać wystąpieniu efektów lub wykorzystać obecność efektów do dostosowania instrumentu i procedur, które zostały użyte. Badacze mogą próbować zapobiegać występowaniu efektów sufitowych używając kilku metod. Pierwszą z nich jest wybór wcześniej zwalidowanej miary poprzez przegląd wcześniejszych badań. Jeśli nie istnieją zwalidowane miary, można przeprowadzić badania pilotażowe z wykorzystaniem proponowanych metod. | Czy kiedykolwiek [ubiegał się Pan/ubiegała się Pani] o rentę inwalidzką z tytułu niezdolności do pracy lub o dodatek opiekuńczy? Jeśli badacze wykorzystują projekt, który nie został wcześniej zatwierdzony, można zastosować kombinację badań, w tym pierwotnie zaproponowane i inne poparte dotychczasową literaturą, aby ocenić obecność efektów sufitowych. Jeśli jakiekolwiek badanie, szczególnie badanie pilotażowe, wykazuje efekt pułapu, należy podjąć wysiłki w celu dostosowania instrumentu, tak aby efekt ten mógł być złagodzony i aby można było przeprowadzić pouczające badania.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.