Statistisk granskning
Konfidensintervall: Intervallskattningen av en populationsparameter, och fastställs vanligen till 95 %. Om man skulle ta 100 stickprov från populationen skulle medelvärdet eller mätningen från 95 av dessa stickprovspopulationer falla inom intervallet 95 % konfidensintervall. Ju närmare eller snävare intervallet för det 95-procentiga konfidensintervallet ligger från det faktiska medelvärdet, desto starkare är resultaten av testet.
Standardfel vid mätning: Det här värdet anger det intervall (+/-) inom vilket en patients verkliga resultat kan ligga inom ett visst test. Om SEM för goniometrisk mätning av rörelseomfång för knäböjning är 3,5 grader kan man förvänta sig en variation av det sanna/aktuella rörelseomfånget på mellan 116,5 och 123,5 grader när det faktiska uppmätta värdet är 120 grader. Den betraktas också som standardavvikelsen för värdena från upprepade testresultat.
Känslighet: Om en patient verkligen har ett tillstånd, hur stor är chansen att det kliniska testet kommer att vara positivt? Detta är ditt mått på sant positiva resultat. Värdena sträcker sig från 0 till 1,0 där 1,0 = 100 % sant positiva resultat. Minnesanteckningen SnOut används för att tillämpa dessa resultat. Om ett test har en hög känslighet och testet är negativt kan en kliniker känna sig bättre på att utesluta sjukdomen (SnOut). Kliniska tester med högre känslighet är bättre för att screena patienter för måltillståndet, men inte lika bra för att ge en specifik diagnos. När ett högkänsligt test är negativt kan man med andra ord känna sig mer säker på att patienten inte har sjukdomen, men om testet är positivt kan man inte vara säker på att patienten har sjukdomen, såvida inte testet också var mycket specifikt.
Specificitet: Om en patient inte har ett tillstånd, hur stor är då chansen att det kliniska testet är negativt? Detta är ditt mått på sant negativa resultat. Värdena sträcker sig från 0 till 1,0 där 1,0 = 100 % sant negativa resultat. Minnesanteckningen SpIn används för att tillämpa dessa resultat. Om ett test har en hög specificitet och testet är positivt kan en kliniker känna sig bättre på att utesluta sjukdomen (SpIn). När ett högspecifikt test är positivt kan man känna sig mer säker på att patienten har sjukdomen, men om testet är negativt kan man inte vara säker på att patienten inte har sjukdomen, om inte testet också var högkänsligt.
Positivt sannolikhetsförhållande (+LR): Uttrycker förändringen i oddsen för att gynna tillståndet när man får ett positivt test. Det är en beräkning av testets specificitet och sensitivitet (+LR = Sensitivitet / 1-Specificitet). En +LR > 1,0 ökar sannolikheten för att ge en korrekt diagnos utifrån testresultatet.
Negativt sannolikhetsförhållande: Uttrycker förändringen i oddsen för att ett tillstånd saknas vid ett negativt testresultat. Det är en beräkning av testets specificitet och sensitivitet (-LR = 1-känslighet/specificitet). En LR < 1,0 ökar sannolikheten att ge en korrekt diagnos utifrån testresultatet.
Odds Ratio: Detta är uppskattningen av den relativa risken och används vanligtvis när den relativa risken inte kan bestämmas exakt på grund av studiens begränsningar (oförmåga att exakt beräkna kumulativ incidens, dvs. en fall-kontrollstudie). Det används ofta för att uttrycka effektstorleken. Det är förhållandet mellan oddsen för att en händelse ska inträffa i en grupp och oddsen för att den ska inträffa i en annan grupp. Det är sannolikheten för att samma händelse eller tillstånd inträffar i två grupper. Ett oddsförhållande på 1:1 innebär att det inte finns någon skillnad i odds mellan grupperna (händelsen eller tillståndet inträffar lika mycket i båda grupperna).
Relativ risk: Detta är måttet på den relativa effekten, vilket är det förhållande som beskriver de risker som är förknippade med den exponerade gruppen jämfört med den oexponerade gruppen. Det anger sannolikheten för att en person som har exponerats för en riskfaktor kommer att utveckla tillståndet i jämförelse med en person som inte har exponerats.
Effektstorlek: Storleken på skillnaden mellan två behandlingar eller förhållandet mellan två variabler. En större effektstorlek för en behandling indikerar att den resulterade i en större positiv skillnad i det resultat som mättes.
Validitet: Mäter det kliniska testet det som det är avsett att mäta? Detta är den fråga som validiteten besvarar. Detta kan ofta mätas med hjälp av värden för sensitivitet och specificitet samt sannolikhetsförhållanden (positiva och negativa prediktiva värden används ofta men är inte lika användbara som sannolikhetsförhållanden).
Tillförlitlighet: Hur väl är undersökarna överens om resultaten av ett test? Reliabilitet är ett mått på överensstämmelse, men inte på validitet. Det baseras på mängden fel som finns i en uppsättning resultat. För att ett kliniskt test ska ha god validitet krävs god tillförlitlighet. Tester som inte har god validitet kan dock fortfarande ha utmärkt tillförlitlighet. Examinatorer kan mäta ett test mycket tillförlitligt mellan sig själva och andra examinatorer, men det betyder inte nödvändigtvis att testet är ett bra mått på ett visst tillstånd eller en viss diagnos. Den mäts med hjälp av koefficienter (Kappa eller Intraclass Correlation Coefficients beroende på typ av variabel).
Kappa: Detta är ett mått på överensstämmelsen som har korrigerats för slumpen. Denna statistik utvärderar andelen observerad överensstämmelse och tar sedan hänsyn till den andel som kan förväntas av slumpen. Den utformades i första hand för att mäta icke-parametriska data, t.ex. dikotoma variabler, som omfattar ja/nej- och positiva/negativa svar, och kategoriska variabler, t.ex. betyg på manuella muskeltest. Poängintervallet sträcker sig från 0 till 10 och tolkningen av poängen har föreslagits som:
1,0 = Perfekt
0,8 till 1,0 = Utmärkt
0,6 till 0,8 = Betydande
0,4 till 0,6 = Måttlig
< 0,4 = Dålig
Vägd Kappa: Den vanliga Kappa-statistiken gör ingen skillnad på oenigheter. Om en forskare vill ge en oenighet större vikt än en annan på grund av större möjliga risker blir det en Weighted Kappa. Vissa meningsskiljaktigheter kan vara allvarligare än andra. Det är inte alla uppgifter som kan särskiljas på detta sätt, men om det är möjligt kan denna viktade Kappa användas för att uppskatta tillförlitligheten.
Intraklass korrelationskoefficient (ICC): ICC är en tillförlitlighetskoefficient. Den beräknar variansen i värderingarna och kan återspegla både graden av överensstämmelse och samförstånd mellan värderingarna. Den sträcker sig från 0 till 1,0. ICC är ett tillförlitlighetsmått som i första hand är utformat för parametriska variabler (intervall- eller kvotdata) som är kontinuerliga, t.ex. mätningar av rörelseomfång, längd, vikt osv. Tolkningen av poängen har föreslagits som:
1,0 = Perfekt
0,9 till 1,0 = Utmärkt
0,75 till 0,9 = Bra
0,5 till 0,75 = Måttlig
< 0,5 = Dålig
Korrelation: Korrelation är ett mått på samband och inte på överensstämmelse (tillförlitlighet mäter överensstämmelse). Den anger det linjära sambandet mellan variabler och sträcker sig från -1 till 0 till 1 och mäts med hjälp av koefficienter (Pearson eller Spearmans). Ju närmare 1 variabeln ligger, desto starkare är den positiva korrelationen och ju närmare -1 desto starkare är den negativa korrelationen. För det mesta innebär en nolla att det inte finns någon korrelation alls mellan variablerna. Korrelationsstorlekar har definierats som:
+/- 0,1 till 0,3 = Liten
+/- 0,3 till 0,5 = Medel
+/- 0,5 till 1,0 = Stor
Korrelationskoefficienter: Statistik som kvantitativt beskriver styrkan och riktningen hos ett samband mellan två variabler.