Statistical Review
Betrouwbaarheidsintervallen: De intervalschatting van een populatieparameter, en gewoonlijk vastgesteld op 95%. Als men 100 steekproeven uit de populatie zou nemen, zou de gemiddelde score of meting van 95 van die steekproefpopulaties binnen het bereik van 95% betrouwbaarheidsintervallen vallen. Hoe dichter of nauwer het bereik van de 95% CI van het werkelijke gemiddelde ligt, des te sterker zijn de resultaten van die test.
Standaardfout van meting: Deze waarde geeft het bereik (+/-) aan waarbinnen de werkelijke score van een patiënt binnen een bepaalde test zou kunnen passen. Als de SEM voor goniometrische meting van het bewegingsbereik voor knieflexie 3,5 graden is, kan men een variatie van het ware/werkelijke bewegingsbereik verwachten tussen 116,5 en 123,5 graden wanneer de werkelijk gemeten waarde 120 graden is. Het is ook te beschouwen als de standaardafwijking van de waarden van herhaalde testscores.
Gevoeligheid: Als een patiënt inderdaad een aandoening heeft, hoe groot is dan de kans dat de klinische test positief zal zijn? Dit is uw maatstaf voor True Positives. De waarden lopen van 0 tot 1,0 waarbij 1,0 = 100% ware positieven. De mnemonische SnOut wordt gebruikt om deze bevindingen toe te passen. Als een test een hoge gevoeligheid heeft en de test is negatief, kan een clinicus zich beter voelen over het uitsluiten van de ziekte (SnOut). Klinische tests met een hogere gevoeligheid zijn beter voor het screenen van patiënten op de doelaandoening, maar niet zo goed voor het stellen van een specifieke diagnose. Met andere woorden, als een zeer gevoelige test negatief is, kan men er zeker van zijn dat de patiënt de aandoening niet heeft, maar als de test positief is, kan men er niet zeker van zijn dat de patiënt de aandoening wel heeft, tenzij de test ook zeer specifiek was.
Specificiteit: Als een patiënt een aandoening niet heeft, hoe groot is dan de kans dat de klinische test negatief zal zijn? Dit is uw maat voor Ware Negatieven. De waarden lopen van 0 tot 1,0 waarbij 1,0 = 100% ware negatieven. De mnemonische SpIn wordt gebruikt om deze bevindingen toe te passen. Als een test een hoge specificiteit heeft en de test positief is, kan een clinicus zich beter voelen over het uitsluiten van de ziekte (SpIn). Wanneer een zeer specifieke test positief is, kan men er zeker van zijn dat de patiënt de aandoening heeft, maar als de test negatief is, kan men er niet zeker van zijn dat hij de aandoening niet heeft, tenzij de test ook zeer gevoelig was.
Positive Likelihood Ratio (+LR): Geeft de verandering in de kans aan die de aandoening begunstigt wanneer een positieve test wordt gegeven. Het is een berekening van de specificiteit en de gevoeligheid van een test (+LR = Sensitiviteit / 1-Specificiteit). Een +LR > 1,0 verhoogt de kans op het stellen van een juiste diagnose op basis van het testresultaat.
Negatieve waarschijnlijkheidsverhouding: Geeft de verandering in de kans weer dat een aandoening afwezig is wanneer een negatieve test wordt gegeven. Het is een berekening van de specificiteit en de sensitiviteit van een test (-LR = 1-Sensitiviteit / Specificiteit). Een LR < 1,0 vergroot de kans dat op basis van het testresultaat een juiste diagnose wordt gesteld.
Odds Ratio: Dit is de schatting van het relatieve risico en wordt typisch gebruikt wanneer het relatieve risico niet nauwkeurig kan worden bepaald op grond van de beperkingen van de studie (onvermogen om cumulatieve incidentie nauwkeurig te berekenen, d.w.z. een case-controlstudie). Het wordt vaak gebruikt om de effectgrootte uit te drukken. Het is de verhouding tussen de kans dat een voorval zich voordoet in een bepaalde groep en de kans dat het zich voordoet in een andere groep. Het is de waarschijnlijkheid dat dezelfde gebeurtenis of aandoening zich in twee groepen voordoet. Een odds ratio van 1:1 betekent dat er geen verschil in kansen is tussen de groepen (de gebeurtenis of aandoening doet zich in beide groepen in gelijke mate voor).
Relatief risico: Dit is de maat voor het relatieve effect, dat wil zeggen de verhouding die de risico’s beschrijft van de blootgestelde groep ten opzichte van de niet-blootgestelde groep. Het geeft aan hoe groot de kans is dat iemand die aan een risicofactor is blootgesteld, de aandoening zal ontwikkelen in vergelijking met iemand die niet is blootgesteld.
Effectgrootte: De grootte van het verschil tussen twee behandelingen of de relatie tussen twee variabelen. Een grotere effectgrootte voor een behandeling geeft aan dat het resulteerde in een groter positief verschil in de uitkomst die werd gemeten.
Validiteit: Meet de klinische test wat hij beoogt te meten? Dit is de vraag die de validiteit beantwoordt. Dit kan vaak worden gemeten aan de hand van sensitiviteits- en specificiteitswaarden en waarschijnlijkheidsverhoudingen (positieve en negatieve voorspellende waarden worden vaak gebruikt, maar zijn niet zo nuttig als likelihood-ratio’s).
Betrouwbaarheid: Hoe goed zijn de examinatoren het eens over de bevindingen van een test? Betrouwbaarheid is een maat voor overeenstemming, maar niet voor validiteit. Zij is gebaseerd op de hoeveelheid fouten die in een reeks scores aanwezig is. Om een klinische test een goede validiteit te laten hebben, is een goede betrouwbaarheid nodig. Maar tests die geen goede validiteit hebben, kunnen toch een uitstekende betrouwbaarheid hebben. Examinatoren kunnen in staat zijn een test zeer betrouwbaar te meten tussen henzelf en andere examinatoren, maar dat betekent niet noodzakelijk dat de test een goede maat is voor een specifieke aandoening of diagnose. Dit wordt gemeten met coëfficiënten (Kappa of Intraclass Correlatie Coëfficiënten, afhankelijk van het type variabele).
Kappa: Dit is een maat voor overeenstemming die voor toeval gecorrigeerd is. Deze statistiek evalueert het aandeel van de waargenomen overeenkomst en houdt vervolgens rekening met het aandeel dat door toeval kan worden verwacht. Hij werd in de eerste plaats ontworpen om niet-parametrische gegevens te meten, zoals dichotome variabelen, waaronder Ja/Nee en Positief/Negatief antwoorden, en categorische variabelen zoals cijfers voor manuele spiertesten. Het bereik van de scores loopt van 0 tot 10 en de interpretatie van de scores is voorgesteld als:
1.0 = Perfect
0.8 tot 1.0 = Excellent
0.6 tot 0.8 = Substantieel
0.4 tot 0.6 = Matig
< 0.4 = Slecht
Gewogen Kappa: De gewone Kappa-statistiek maakt geen onderscheid tussen meningsverschillen. Als een onderzoeker aan een meningsverschil een groter gewicht wil toekennen dan aan een ander vanwege de grotere mogelijke risico’s, dan wordt het een Weighted Kappa. Sommige meningsverschillen kunnen ernstiger zijn dan andere. Niet alle gegevens kunnen op deze manier worden onderscheiden, maar als dat wel het geval is, kan deze Weighted Kappa worden gebruikt om de betrouwbaarheid te schatten.
Intraclass Correlation Coefficient (ICC): De ICC is een betrouwbaarheidscoëfficiënt. Hij berekent de variantie in de scores en kan zowel de mate van overeenstemming als de mate van overeenstemming tussen de beoordelingen weergeven. Hij varieert van 0 tot 1,0. De ICC is een betrouwbaarheidsmaat die in de eerste plaats is ontworpen voor parametrische variabelen (interval- of verhoudingsgegevens), die continu zijn, zoals metingen van het bewegingsbereik, lengte, gewicht, enz. De interpretatie van de scores is voorgesteld als:
1.0 = Perfect
0.9 tot 1.0 = Uitstekend
0.75 tot 0.9 = Goed
0.5 tot 0.75 = Matig
< 0.5 = Slecht
Correlatie: Correlatie is een maat voor associatie en niet voor overeenstemming (betrouwbaarheid meet overeenstemming). Zij geeft het lineaire verband tussen variabelen aan en loopt van -1 tot 0 tot 1 en wordt gemeten met coëfficiënten (Pearson of Spearmans). Hoe dichter de variabele bij 1 ligt, hoe sterker de positieve correlatie en hoe dichter bij -1 hoe sterker de negatieve correlatie. Meestal duidt een nul op geen enkele correlatie tussen de variabelen. Correlatiegroottes zijn gedefinieerd als:
+/- 0,1 tot 0,3 = Klein
+/- 0,3 tot 0,5 = Middelgroot
+/- 0,5 tot 1,0 = Groot
Correlatiecoëfficiënten: Statistieken die kwantitatief de sterkte en richting van een relatie tussen twee variabelen beschrijven.