Statistical Review
Confidence Intervals(信頼区間)。 母集団のパラメーターの区間推定値で、通常95%で設定される。 母集団から100個のサンプルを取る場合、それらのサンプル母集団の95個からの平均スコアまたは測定値は95%信頼区間の範囲内に入ることになる。 95%信頼区間の範囲が実際の平均値に近ければ近いほど、あるいは狭ければ狭いほど、そのテストの結果は強くなります。
標準誤差(Standard Error of Measurement)。 この値は、あるテストにおいて、患者の真のスコアが収まるかもしれない範囲(±)を示す。 膝関節屈曲可動域のゴニオメトリック測定のSEMが3.5度であれば、実際の測定値が120度である場合、真の可動域/実際の可動域の変動は116.5~123.5度であると予想されます。 また、繰り返し行われるテストのスコアによる値の標準偏差とも考えられている。
感度。 患者がある状態であった場合、臨床検査が陽性となる確率はどのくらいでしょうか。 これはTrue Positivesの指標となります。 値は0から1.0まであり、1.0=100%True Positivesとなる。 これらの知見を応用するために、ニーモニックSnOutが使用されます。 ある検査の感度が高く、検査が陰性であれば、臨床医は病気を除外することができ、安心することができます(SnOut)。 感度の高い臨床検査は、対象疾患のスクリーニングには適しているが、具体的な診断を下すにはあまり適していない。 言い換えれば、感度の高い検査が陰性であれば、患者はその疾患にかかっていないと確信できるが、検査が陽性であれば、その検査が高い特異性を持っていない限り、患者がその疾患にかかっていると確信することはできないのである。
特異性。 患者が病態を持っていない場合、臨床検査が陰性になる可能性はどのくらいでしょうか。 これはTrue Negativesの指標となります。 値は0から1.0まであり、1.0=100%True Negativeとなる。 これらの知見を応用するために、ニーモニックSpInが使用される。 もし、ある検査が高い特異性を持ち、その検査が陽性であれば、臨床医は病気の除外(SpIn)に対して安心することができます。 特異度の高い検査が陽性であれば、その患者がその病気であることを確信できるが、陰性であれば、その検査が高感度でない限り、その患者がその病気でないことを確信することはできないのである。
正の尤度比(+LR)。 テストが陽性であった場合に、その状態に有利なオッズの変化を表す。 検査の特異度と感度を計算したものである(+LR = 感度 / 1-特異度)。 +LR > 1.0は、検査結果に基づいて正しい診断を提供する可能性が高くなります。
消極的尤度比(Negative Likelihood Ratio)。 検査が陰性であった場合に、ある疾患が存在しない確率の変化を表します。 検査の特異度と感度を計算したものです(-LR = 1-Sensitivity / Specificity)。 LR < 1.0は、検査結果に基づいて正しい診断を提供する可能性が高くなります。
オッズ比。 これは相対リスクの推定値で、通常、研究の限界(累積罹患率を正確に計算できない、すなわち症例対照研究)に基づき相対リスクを正確に決定できない場合に使用されます。 効果の大きさを表すのによく使われます。 ある事象がある群で発生するオッズと、別の群で発生するオッズの比である。 同じ事象や状態が2つのグループで発生する確率です。 オッズ比が1:1であれば、グループ間のオッズに差がない(イベントや状態が両グループで等しく発生する)ことを意味します。
相対リスク:これは相対効果の指標で、被曝群と非被曝群を比較した場合のリスクを表す比率です。 危険因子に曝露された人が、曝露されていない人と比較して、その状態を発症する可能性を示しています。
効果の大きさ。 2つの治療法間の差の大きさ、または2つの変数間の関係の大きさ。 1つの治療の効果サイズが大きければ大きいほど、測定された結果においてより大きな正の差をもたらしたことを示す。
Validity(妥当性):妥当性。 臨床検査は測定しようとするものを測定しているか。 これは妥当性が答える質問である。 これは感度や特異度、尤度比(陽性・陰性予測値はよく使われますが、尤度比ほど有用ではありません)などで測定されることが多いのです。
信頼性:ある検査の所見について、検査者がどの程度同意しているか? 信頼性は一致度の指標であり、妥当性の指標ではありません。 これは、一連のスコアに存在する誤差の量に基づいています。 臨床検査が優れた妥当性を持つためには、優れた信頼性が必要です。 しかし、妥当性が良くないテストでも、優れた信頼性を持っている場合があります。 検査者は、自分と他の検査者の間で非常に高い信頼性を持ってテストを測定することができるかもしれませんが、それは必ずしもそのテストが特定の状態や診断の良い指標であることを意味するわけではありません。 これは係数(変数の種類によってカッパまたはクラス内相関係数)によって測定されます。
カッパ:これは偶然性が補正された一致度の指標です。 この統計量は、観察された一致の比率を評価し、そして、偶然に期待される比率を考慮します。 主に、Yes/NoやPositive/Negativeなどの二項変数や、徒手筋力テストの成績などのカテゴリー変数のようなノンパラメトリックなデータを測定するために設計された。
1.0 = 完璧
0.8 から 1.0 = 優秀
0.6 から 0.8 = 相当
0.4 から 0.6 = 中程度
< 0.4 = 悪い
重量カッパ:通常のカッパ統計は不一致度を区別していない。 研究者が、より大きな可能性のあるリスクのために、ある不一致に他のものより大きな重みを割り当てたい場合、それは重みつきカッパになる。 ある不一致は、他の不一致より深刻かもしれません。 すべてのデータがこのように区別できるわけではありませんが、もし区別できるのであれば、この重み付きカッパは信頼性を推定するのに使うことができます。
クラス内相関係数(ICC)。 ICCは信頼性係数の一つです。 スコアの分散を計算し、評価間の対応と一致の度合いを反映させることができる。 0から1.0までの範囲で表される。 ICC は、主に可動域測定、身長、体重などの連続的なパラメトリック変数(区間または比率データ)用に設計された信頼性の尺度である。 スコアの解釈は、
1.0 = Perfect
0.9 to 1.0 = Excellent
0.75 to 0.9 = Good
0.5 to 0.75 = Moderate
< 0.5 = Poor
Correlation.のように示唆されている。 相関は関連性の尺度であり、一致度の尺度ではない(信頼性は一致度を測る)。 変数間の線形関係を示し、範囲は-1~0~1、係数(ピアソンまたはスピアマン)で測定される。 変数が1に近いほど正の相関が強く、-1に近いほど負の相関が強い。 ほとんどの場合、0は変数間に全く相関がないことを示す。 相関の大きさは、
+/- 0.1 ~ 0.3 = 小
+/- 0.3 ~ 0.5 = 中
+/- 0.5 ~ 1.0 = 大
相関係数と定義されている。 2つの変数間の関係の強さと方向を定量的に表す統計量。