Przegląd statystyczny
Przedziały ufności: Szacunek przedziałowy parametru populacji, zwykle ustalany na poziomie 95%. Jeśli ktoś miałby pobrać 100 próbek z populacji, średni wynik lub pomiar z 95 z tych próbek populacji mieściłby się w zakresie 95% przedziałów ufności. Im bliżej lub ciaśniej, że zakres 95% CI jest od rzeczywistej średniej, tym silniejsze wyniki tego testu.
Błąd standardowy pomiaru: Ta wartość mówi o zakresie (+/-), w którym prawdziwy wynik pacjenta może mieścić się w ramach danego testu. Jeśli SEM dla goniometrycznego pomiaru zakresu ruchu zgięcia kolana wynosi 3,5 stopnia, wówczas można oczekiwać, że odchylenie prawdziwego/rzeczywistego zakresu ruchu wyniesie od 116,5 do 123,5 stopnia, podczas gdy rzeczywista zmierzona wartość wynosi 120 stopni. Jest to również uważane za odchylenie standardowe wartości z powtarzających się wyników testu.
Czułość: Jeśli pacjent rzeczywiście ma chorobę, jakie są szanse, że test kliniczny będzie pozytywny? Jest to miara liczby wyników prawdziwie pozytywnych. Wartości wahają się od 0 do 1,0, gdzie 1,0 = 100% wyników prawdziwie pozytywnych. Do zastosowania tych wyników używa się mnemonika SnOut. Jeśli test ma wysoką czułość i wynik jest negatywny, klinicysta może czuć się lepiej z wykluczeniem choroby (SnOut). Testy kliniczne o wyższej czułości są lepsze do badania przesiewowego pacjentów pod kątem stanu docelowego, ale nie są tak dobre do postawienia konkretnej diagnozy. Innymi słowy, kiedy wysoce czuły test jest negatywny, możesz czuć się bardziej pewny, że pacjent nie ma choroby, jednak jeśli test jest pozytywny, nie możesz być pewny, że pacjent ma tę chorobę, chyba że test był również wysoce specyficzny.
Swoistość: Jeśli pacjent nie ma stanu chorobowego, jakie są szanse, że test kliniczny będzie negatywny? Jest to miara Prawdziwych Negatywów. Wartości wahają się od 0 do 1,0, gdzie 1,0 = 100% prawdziwych negatywów. Mnemonik SpIn jest używany do zastosowania tych ustaleń. Jeśli test ma wysoką specyficzność i jest pozytywny, klinicysta może czuć się lepiej z wykluczeniem choroby (SpIn). Kiedy wysoce specyficzny test jest pozytywny, możesz czuć się pewniej, że pacjent rzeczywiście ma chorobę, jednak jeśli test jest negatywny, nie możesz być pewny, że nie ma tej choroby, chyba że test był również wysoce czuły.
Dodatni Współczynnik Prawdopodobieństwa (+LR): Wyraża zmianę w szansach faworyzowania stanu chorobowego po otrzymaniu pozytywnego testu. Jest to obliczenie swoistości i czułości testu (+LR = Czułość / 1-Szczególność). A +LR > 1.0 zwiększa prawdopodobieństwo postawienia prawidłowej diagnozy na podstawie wyniku testu.
Negatywny współczynnik prawdopodobieństwa: Wyraża zmianę w szansach, że stan jest nieobecny, gdy wynik testu jest negatywny. Jest to obliczenie swoistości i czułości testu (-LR = 1-Sensitivity / Specificity). LR < 1,0 zwiększa prawdopodobieństwo postawienia prawidłowej diagnozy na podstawie wyniku testu.
Odds Ratio: Jest to oszacowanie ryzyka względnego i jest zwykle stosowane, gdy ryzyko względne nie może być dokładnie określone na podstawie ograniczeń badania (niemożność dokładnego obliczenia skumulowanej częstości występowania, tj. badanie case-control). Jest on często używany do wyrażenia wielkości efektu. Jest to stosunek prawdopodobieństwa wystąpienia zdarzenia w jednej grupie do prawdopodobieństwa jego wystąpienia w innej grupie. Jest to prawdopodobieństwo wystąpienia tego samego zdarzenia lub stanu w dwóch grupach. Stosunek szans 1:1 oznacza brak różnicy szans między grupami (zdarzenie lub stan występuje w równym stopniu w obu grupach).
Ryzyko względne: Jest to miara względnego skutku, czyli stosunek, który opisuje ryzyko związane z grupą narażoną w porównaniu z grupą nie narażoną. Wskazuje prawdopodobieństwo, że u kogoś, kto był narażony na działanie czynnika ryzyka, rozwinie się choroba w porównaniu z kimś, kto nie był narażony.
Wielkość efektu: Wielkość różnicy między dwoma sposobami leczenia lub związkiem między dwoma zmiennymi. Większy rozmiar efektu dla jednego leczenia wskazuje, że spowodowało to większą pozytywną różnicę w wyniku, który został zmierzony.
Ważność: Czy test kliniczny mierzy to, co jest przeznaczone do pomiaru? Jest to pytanie, na które odpowiada ważność. Często można to zmierzyć za pomocą wartości czułości i swoistości, jak również współczynników prawdopodobieństwa (dodatnie i ujemne wartości predykcyjne są często używane, ale nie są tak pomocne jak współczynniki prawdopodobieństwa).
Wiarygodność: Jak dobrze egzaminatorzy zgadzają się co do wyników testu? Wiarygodność jest miarą zgodności, ale nie ważności. Jest ona oparta na wielkości błędu, który jest obecny w zestawie wyników. Aby test kliniczny miał dobrą wiarygodność, konieczna jest dobra rzetelność. Jednakże, testy, które nie mają dobrej ważności, mogą nadal mieć doskonałą rzetelność. Egzaminatorzy mogą być w stanie zmierzyć test bardzo rzetelnie między sobą i innymi egzaminatorami, ale to niekoniecznie oznacza, że test jest dobrą miarą konkretnego stanu lub diagnozy. Jest ona mierzona za pomocą współczynników (Kappa lub Współczynniki korelacji wewnątrzklasowej w zależności od rodzaju zmiennej).
Kappa: Jest to miara zgodności, która została skorygowana o prawdopodobieństwo. Statystyka ta ocenia proporcję zaobserwowanej zgodności, a następnie bierze pod uwagę proporcję, której można oczekiwać na podstawie przypadku. Została ona zaprojektowana głównie do pomiaru danych nieparametrycznych, takich jak zmienne dychotomiczne, które obejmują odpowiedzi Tak/Nie i Pozytywne/Negatywne oraz zmienne kategoryczne, takie jak oceny testów mięśni manualnych. Zakres wyników wynosi od 0 do 10, a interpretacja wyników została zasugerowana jako:
1.0 = Doskonały
0.8 do 1.0 = Doskonały
0.6 do 0.8 = Znaczący
0.4 do 0.6 = Umiarkowany
< 0.4 = Słaby
Ważona Kappa: Zwykła statystyka Kappa nie różnicuje niezgodności. Jeśli badacz chce przypisać większą wagę jednemu nieporozumieniu niż innemu z powodu większego możliwego ryzyka, wtedy staje się ona Kappa ważoną. Niektóre niezgodności mogą być poważniejsze niż inne. Nie wszystkie dane mogą być zróżnicowane w ten sposób, ale jeśli mogą, wtedy ważona kappa może być użyta do oszacowania wiarygodności.
Współczynnik korelacji wewnątrzklasowej (ICC): ICC jest współczynnikiem niezawodności. Oblicza wariancję w wynikach i jest w stanie odzwierciedlić zarówno stopień zgodności i porozumienia między ocenami. Waha się od 0 do 1,0. ICC jest miarą rzetelności zaprojektowaną głównie dla zmiennych parametrycznych (dane interwałowe lub ratio), które są ciągłe, takie jak pomiary zakresu ruchu, wzrostu, wagi, itp. Interpretacja wyników została zaproponowana jako:
1.0 = Doskonały
0.9 do 1.0 = Doskonały
0.75 do 0.9 = Dobry
0.5 do 0.75 = Umiarkowany
< 0.5 = Słaby
Korelacja: Korelacja jest miarą asocjacji, a nie porozumienia (wiarygodność mierzy porozumienie). Wskazuje liniowy związek między zmiennymi i mieści się w zakresie od -1 do 0 do 1 i jest mierzona za pomocą współczynników (Pearsona lub Spearmansa). Im zmienna jest bliższa 1, tym silniejsza jest korelacja dodatnia, a im bliższa -1, tym silniejsza jest korelacja ujemna. W większości przypadków zero oznacza brak jakiejkolwiek korelacji między zmiennymi. Wielkości korelacji zostały zdefiniowane jako:
+/- 0.1 do 0.3 = Mała
+/- 0.3 do 0.5 = Średnia
+/- 0.5 do 1.0 = Duża
Współczynniki korelacji: Statystyka, która w sposób ilościowy opisuje siłę i kierunek związku między dwiema zmiennymi.