Statistisk gennemgang
Konfidensintervaller: Intervalskønnet for en populationsparameter, og er normalt fastsat til 95 %. Hvis man tager 100 stikprøver fra populationen, vil den gennemsnitlige score eller måling fra 95 af disse stikprøvepopulationer ligge inden for 95 % konfidensintervallet. Jo tættere eller snævrere intervallet i 95 % CI er på det faktiske gennemsnit, jo stærkere er resultaterne af den pågældende test.
Standardfejl ved måling: Denne værdi angiver det interval (+/-), inden for hvilket en patients sande score kan passe inden for en given test. Hvis SEM for goniometrisk måling af bevægelsesomfanget for knæbøjning er 3,5 grader, kan man forvente en variation af det sande/virkelige bevægelsesomfang på mellem 116,5 og 123,5 grader, når den faktisk målte værdi er 120 grader. Den opfattes også som standardafvigelsen af værdierne fra gentagne testresultater.
Følsomhed: Hvis en patient har en tilstand, hvad er så chancerne for, at den kliniske test vil være positiv? Dette er dit mål for sande positive resultater. Værdierne varierer fra 0 til 1,0, hvor 1,0 = 100 % sande positive resultater. Den mnemoniske SnOut bruges til at anvende disse resultater. Hvis en test har en høj sensitivitet, og testen er negativ, kan en kliniker føle sig bedre tilpas med hensyn til at udelukke sygdommen (SnOut). Kliniske test med højere sensitivitet er bedre til at screene patienter for den pågældende tilstand, men er ikke så gode til at stille en specifik diagnose. Med andre ord, når en højsensitiv test er negativ, kan man være mere sikker på, at patienten ikke har sygdommen, men hvis testen er positiv, kan man ikke være sikker på, at patienten har den pågældende sygdom, medmindre testen også var meget specifik.
Specificitet: Hvis en patient ikke har en sygdom, hvad er så chancerne for, at den kliniske test er negativ? Dette er dit mål for sandt negative resultater. Værdierne varierer fra 0 til 1,0, hvor 1,0 = 100 % true negatives. Den mnemotekniske metode SpIn bruges til at anvende disse resultater. Hvis en test har en høj specificitet, og testen er positiv, kan en kliniker føle sig bedre tilpas med hensyn til at udelukke sygdommen (SpIn). Når en meget specifik test er positiv, kan man være mere sikker på, at patienten har sygdommen, men hvis testen er negativ, kan man ikke være sikker på, at patienten ikke har sygdommen, medmindre testen også var meget følsom.
Positive Likelihood Ratio (+LR): Udtrykker ændringen i oddsene for at favorisere tilstanden, når man får en positiv test. Det er en beregning af en tests specificitet og sensitivitet (+LR = Sensitivitet / 1-Specificitet). Et +LR > 1,0 øger sandsynligheden for at stille en korrekt diagnose på grundlag af testresultatet.
Negative Likelihood Ratio: Udtrykker ændringen i oddsene for, at en tilstand er fraværende, når der gives et negativt testresultat. Det er en beregning af en tests specificitet og sensitivitet (-LR = 1-Sensitivitet / Specificitet). Et LR < 1,0 øger sandsynligheden for at stille en korrekt diagnose på grundlag af testresultatet.
Odds Ratio: Dette er et skøn over den relative risiko og anvendes typisk, når den relative risiko ikke kan bestemmes nøjagtigt på grund af undersøgelsens begrænsninger (manglende mulighed for nøjagtig beregning af kumulativ incidens, dvs. en case-kontrol-undersøgelse). Det bruges ofte til at udtrykke effektstørrelsen. Det er forholdet mellem oddsene for, at en hændelse forekommer i en gruppe, og oddsene for, at den forekommer i en anden gruppe. Det er sandsynligheden for, at den samme hændelse eller tilstand forekommer i to grupper. Et odds ratio på 1:1 betyder, at der ikke er nogen forskel i odds mellem grupperne (hændelsen eller tilstanden forekommer lige meget i begge grupper).
Relativ risiko: Dette er et mål for den relative effekt, som er det forhold, der beskriver de risici, der er forbundet med den eksponerede gruppe sammenlignet med den ikke-eksponerede gruppe. Det angiver sandsynligheden for, at en person, der har været udsat for en risikofaktor, vil udvikle tilstanden sammenlignet med en person, der ikke har været udsat.
Effektstørrelse: Størrelsen af forskellen mellem to behandlinger eller forholdet mellem to variabler. En større effektstørrelse for en behandling angiver, at den resulterede i en større positiv forskel i det resultat, der blev målt.
Validitet: Måler den kliniske test det, som den er beregnet til at måle? Dette er det spørgsmål, som validiteten besvarer. Dette kan ofte måles ved hjælp af værdier for følsomhed og specificitet samt sandsynlighedsforhold (positive og negative prædiktive værdier anvendes ofte, men er ikke lige så nyttige som sandsynlighedsforhold).
Pålidelighed: Hvor godt er undersøgerne enige om resultaterne af en test? Reliabilitet er et mål for enighed, men ikke for validitet. Den er baseret på den fejlmængde, der er til stede i et sæt scoringer. For at en klinisk test kan have en god validitet, er det nødvendigt med en god pålidelighed. Test, der ikke har en god validitet, kan dog stadig have en fremragende pålidelighed. Eksaminatorer kan være i stand til at måle en test meget pålideligt mellem sig selv og andre eksaminatorer, men det betyder ikke nødvendigvis, at testen er en god målestok for en bestemt tilstand eller diagnose. Den måles ved hjælp af koefficienter (Kappa- eller Intraclass-korrelationskoefficienter, afhængigt af typen af variabel).
Kappa: Dette er et mål for overensstemmelse, der er blevet chancekorrigeret. Denne statistik evaluerer andelen af observeret overensstemmelse og tager derefter hensyn til den andel, der kan forventes ved tilfældigheder. Den blev primært udviklet til at måle ikke-parametriske data såsom dikotome variabler, der omfatter Ja/Nej- og Positiv/Negativ-svar, og kategoriske variabler såsom karakterer i manuelle muskeltest. Scoreintervallet går fra 0 til 10, og fortolkningen af scores er blevet foreslået som:
1,0 = Perfekt
0,8 til 1,0 = Fremragende
0,6 til 0,8 = Væsentlig
0,4 til 0,6 = Moderat
< 0,4 = Dårlig
Vægtet Kappa: Den almindelige Kappa-statistik skelner ikke mellem uoverensstemmelser. Hvis en forsker ønsker at tildele en større vægt til en uenighed frem for en anden på grund af større mulige risici, bliver det til en vægtet Kappa-statistik. Nogle uoverensstemmelser kan være mere alvorlige end andre. Det er ikke alle data, der kan differentieres på denne måde, men hvis de kan det, kan denne vægtede Kappa anvendes til at vurdere pålideligheden.
Intraclass Correlation Coefficient (ICC): ICC er en pålidelighedskoefficient. Den beregner variansen i scoringer og er i stand til at afspejle både graden af overensstemmelse og overenstemmelse mellem vurderinger. Den varierer fra 0 til 1,0. ICC er et mål for pålidelighed, der primært er beregnet til parametriske variabler (interval- eller forholdsdata), som er kontinuerlige, f.eks. målinger af bevægelsesomfang, højde, vægt osv. Fortolkningen af scorer er blevet foreslået som:
1,0 = Perfekt
0,9 til 1,0 = Fremragende
0,75 til 0,9 = God
0,5 til 0,75 = Moderat
< 0,5 = Dårlig
Korrelation: Korrelation er et mål for association og ikke for overensstemmelse (pålidelighed måler overensstemmelse). Den angiver den lineære sammenhæng mellem variabler og går fra -1 til 0 til 1 og måles ved hjælp af koefficienter (Pearson- eller Spearmans-koefficienter). Jo tættere variablen ligger på 1, jo stærkere er den positive korrelation, og jo tættere på -1, jo stærkere er den negative korrelation. Et nul angiver for det meste, at der slet ikke er nogen sammenhæng mellem variablerne. Korrelationsstørrelser er blevet defineret som:
+/- 0,1 til 0,3 = Lille
+/- 0,3 til 0,5 = Middel
+/- 0,5 til 1,0 = Stor
Korrelationskoefficienter: Statistikker, der kvantitativt beskriver styrken og retningen af en sammenhæng mellem to variabler.