Revisión estadística
Intervalos de confianza: La estimación del intervalo de un parámetro poblacional, y normalmente se establece en un 95%. Si se tomaran 100 muestras de la población, la puntuación o medida media de 95 de esas muestras de población estaría dentro del rango de los Intervalos de Confianza del 95%. Cuanto más cerca o más ajustado esté el rango del IC del 95% de la media real, más fuertes serán los resultados de esa prueba.
Error estándar de medición: Este valor indica el rango (+/-) dentro del cual podría encajar la puntuación real de un paciente en una prueba determinada. Si el SEM para la medición goniométrica de la amplitud de movimiento para la flexión de la rodilla es de 3,5 grados, se podría esperar una variación de la amplitud de movimiento verdadera/real de entre 116,5 y 123,5 grados cuando el valor real medido es de 120 grados. También se piensa en la desviación estándar de los valores de las puntuaciones de las pruebas repetidas.
Sensibilidad: Si un paciente tiene una afección, ¿cuáles son las posibilidades de que la prueba clínica sea positiva? Esta es su medida de Verdaderos Positivos. Los valores van de 0 a 1,0 donde 1,0 = 100% de verdaderos positivos. Para aplicar estos resultados se utiliza la nemotecnia SnOut. Si una prueba tiene una alta sensibilidad y la prueba es negativa, el clínico puede sentirse mejor al descartar la enfermedad (SnOut). Las pruebas clínicas con mayor sensibilidad son mejores para el cribado de pacientes para la condición objetivo, pero no son tan buenas para proporcionar un diagnóstico específico. En otras palabras, cuando una prueba de alta sensibilidad es negativa, puede sentirse más seguro de que el paciente no tiene la condición, sin embargo, si la prueba es positiva, no puede estar seguro de que tiene esa condición, a menos que la prueba también sea altamente específica.
Especificidad: Si un paciente no tiene una enfermedad, ¿cuáles son las posibilidades de que la prueba clínica sea negativa? Esta es la medida de los verdaderos negativos. Los valores van de 0 a 1,0 donde 1,0 = 100% de verdaderos negativos. Para aplicar estos resultados se utiliza la nemotecnia SpIn. Si una prueba tiene una alta especificidad y la prueba es positiva, el clínico puede sentirse mejor para descartar la enfermedad (SpIn). Cuando una prueba altamente específica es positiva, se puede estar más seguro de que el paciente tiene la enfermedad, pero si la prueba es negativa, no se puede asegurar que no tenga esa enfermedad, a menos que la prueba también sea altamente sensible.
Relación de probabilidad positiva (+LR): Expresa el cambio en las probabilidades que favorecen la condición cuando se da una prueba positiva. Es un cálculo de la especificidad y la sensibilidad de una prueba (+LR = Sensibilidad / 1-Especificidad). Un +LR > 1,0 aumenta la probabilidad de proporcionar un diagnóstico correcto basado en el resultado de la prueba.
Relación de probabilidad negativa: Expresa el cambio en las probabilidades de que una condición esté ausente cuando se da una prueba negativa. Es un cálculo de la especificidad y la sensibilidad de una prueba (-LR = 1-Sensibilidad / Especificidad). Un LR < 1,0 aumenta la probabilidad de proporcionar un diagnóstico correcto basado en el resultado de la prueba.
Odds Ratio: Es la estimación del riesgo relativo y se suele utilizar cuando el riesgo relativo no puede determinarse con exactitud debido a las limitaciones del estudio (incapacidad para calcular con precisión la incidencia acumulada, es decir, un estudio de casos y controles). Suele utilizarse para expresar el tamaño del efecto. Es la relación entre las probabilidades de que un acontecimiento ocurra en un grupo y las probabilidades de que ocurra en otro grupo. Es la probabilidad de que se produzca el mismo acontecimiento o condición en dos grupos. Un cociente de probabilidades de 1:1 significa que no hay diferencia en las probabilidades entre los grupos (el acontecimiento o condición ocurre por igual en ambos grupos).
Riesgo relativo: Es la medida del efecto relativo, que es la proporción que describe los riesgos asociados al grupo expuesto en comparación con el grupo no expuesto. Indica la probabilidad de que alguien que ha estado expuesto a un factor de riesgo desarrolle la enfermedad en comparación con alguien que no ha estado expuesto.
Tamaño del efecto: La magnitud de la diferencia entre dos tratamientos o la relación entre dos variables. Un mayor tamaño del efecto para un tratamiento indica que dio lugar a una mayor diferencia positiva en el resultado que se midió.
Validez: ¿Mide la prueba clínica lo que pretende medir? Esta es la pregunta a la que responde la validez. Esto puede medirse a menudo mediante los valores de sensibilidad y especificidad, así como los cocientes de probabilidad (los valores predictivos positivos y negativos se utilizan a menudo, pero no son tan útiles como los cocientes de probabilidad).
Fiabilidad: ¿En qué medida coinciden los examinadores en los resultados de una prueba? La fiabilidad es una medida de acuerdo, pero no de validez. Se basa en la cantidad de error presente en un conjunto de puntuaciones. Para que una prueba clínica tenga una buena validez, se requiere una buena fiabilidad. Sin embargo, las pruebas que no tienen una buena validez pueden tener una excelente fiabilidad. Los examinadores pueden ser capaces de medir una prueba de forma muy fiable entre ellos y otros examinadores, pero eso no significa necesariamente que la prueba sea una buena medida de una condición o diagnóstico específico. Se mide mediante coeficientes (Kappa o Coeficientes de Correlación Intraclase, según el tipo de variable).
Kappa: Es una medida de concordancia corregida por el azar. Este estadístico evalúa la proporción de acuerdo observado y luego tiene en cuenta la proporción que puede esperarse por azar. Se diseñó principalmente para medir datos no paramétricos como las variables dicotómicas, que incluyen respuestas Sí/No y Positivo/Negativo, y variables categóricas como las calificaciones de las pruebas musculares manuales. El rango de puntuaciones va de 0 a 10 y la interpretación de las puntuaciones se ha sugerido como:
1,0 = Perfecto
0,8 a 1,0 = Excelente
0,6 a 0,8 = Sustancial
0,4 a 0,6 = Moderado
< 0,4 = Pobre
Kappa ponderado: El estadístico Kappa normal no diferencia entre los desacuerdos. Si un investigador quiere asignar un mayor peso a un desacuerdo sobre otro debido a los mayores riesgos posibles, entonces se convierte en un Kappa ponderado. Algunos desacuerdos pueden ser más graves que otros. No todos los datos se pueden diferenciar de esta manera, pero si se puede entonces este Kappa ponderado se puede utilizar para estimar la fiabilidad.
Coeficiente de Correlación Intraclase (CCI): El ICC es un coeficiente de fiabilidad. Calcula la varianza de las puntuaciones y es capaz de reflejar tanto el grado de correspondencia como la concordancia entre las valoraciones. Va de 0 a 1,0. El CCI es una medida de fiabilidad diseñada principalmente para variables paramétricas (datos de intervalo o relación), que son continuas, como las mediciones de la amplitud de movimiento, la altura, el peso, etc. La interpretación de las puntuaciones se ha sugerido como:
1,0 = Perfecto
0,9 a 1,0 = Excelente
0,75 a 0,9 = Bueno
0,5 a 0,75 = Moderado
< 0,5 = Pobre
Correlación: La correlación es una medida de asociación y no de acuerdo (la fiabilidad mide el acuerdo). Indica la relación lineal entre las variables y va de -1 a 0 a 1 y se mide mediante coeficientes (Pearson o Spearmans). Cuanto más se acerque la variable a 1, más fuerte será la correlación positiva y cuanto más se acerque a -1, más fuerte será la correlación negativa. En la mayoría de los casos, un cero indica que no hay ninguna correlación entre las variables. Los tamaños de las correlaciones se han definido como:
+/- 0,1 a 0,3 = Pequeña
+/- 0,3 a 0,5 = Media
+/- 0,5 a 1,0 = Grande
Coeficientes de correlación: Estadísticas que describen cuantitativamente la fuerza y la dirección de una relación entre dos variables.