Statistische Intervalle verstehen: Teil 2 – Vorhersageintervalle

In Teil 1 dieser Serie wurden Konfidenzintervalle behandelt. Konfidenzintervalle sind die bekanntesten der statistischen Intervalle, aber sie begrenzen nur Bereiche, die mit Populationsparametern verbunden sind, d.h. mit dem Mittelwert oder der Standardabweichung einer Population. Was aber, wenn wir uns statt für den Mittelwert oder die Standardabweichung für einzelne Beobachtungen aus einer Grundgesamtheit interessieren? Hierfür können wir das Vorhersageintervall verwenden.

Vorhersageintervalle stellen die Unsicherheit bei der Vorhersage des Wertes einer einzelnen künftigen Beobachtung oder einer festen Anzahl mehrerer künftiger Beobachtungen aus einer Grundgesamtheit auf der Grundlage der Verteilung oder Streuung einer Reihe früherer Beobachtungen dar. Ähnlich wie das Konfidenzintervall sollten Vorhersageintervalle, die aus einer einzelnen Stichprobe berechnet werden, nicht so interpretiert werden, dass ein bestimmter Prozentsatz zukünftiger Beobachtungen immer innerhalb des Intervalls enthalten sein wird; vielmehr sollte ein Vorhersageintervall so interpretiert werden, dass ein Vorhersageintervall, wenn es für eine Reihe aufeinanderfolgender Stichproben aus derselben Grundgesamtheit berechnet wird, in einem bestimmten Prozentsatz der Zeit eine zukünftige Beobachtung enthalten wird.

Beispiel: Wenn wir eine Stichprobe von Beobachtungen sammeln und auf der Grundlage dieser Stichprobe ein 95 %iges Vorhersageintervall berechnen, besteht eine 95 %ige Wahrscheinlichkeit, dass eine künftige Beobachtung innerhalb des Vorhersageintervalls enthalten ist. Umgekehrt besteht auch eine 5 %ige Wahrscheinlichkeit, dass die nächste Beobachtung nicht im Intervall enthalten ist. Wenn wir 20 Stichproben erheben und für jede ein Vorhersageintervall berechnen, können wir davon ausgehen, dass 19 der berechneten Intervalle eine einzige zukünftige Beobachtung enthalten werden, während 1 der berechneten Intervalle keine einzige zukünftige Beobachtung enthalten wird. Diese Interpretation des Vorhersageintervalls wird in Abbildung 1 grafisch dargestellt.

Abbildung 1. Darstellung der oberen und unteren Grenzen des Vorhersageintervalls für 20 Stichproben, die jeweils aus 10 pH-Messungen bestehen, die aus derselben Grundgesamtheit stammen. Die Darstellung umfasst auch 20 einzelne zukünftige Beobachtungen. Beachten Sie, dass 1 der 20 einzelnen zukünftigen pH-Messwerte (rot eingekreist) außerhalb der zugehörigen Vorhersageintervallregion liegt. Dies entspricht den 5 % der Intervalle, die bei einem Konfidenzniveau von 95 % voraussichtlich keine einzige zukünftige Beobachtung enthalten.

Vorhersageintervalle werden am häufigsten in der Regressionsstatistik verwendet, können aber auch bei normalverteilten Daten eingesetzt werden. Die Berechnung eines Vorhersageintervalls für normalverteilte Daten ist viel einfacher als die für regressive Daten, daher beginnen wir dort.

Vorhersageintervall für normale Daten

Die Formel für ein Vorhersageintervall ist fast identisch mit der Formel, die zur Berechnung eines Konfidenzintervalls verwendet wird. Die Formel für ein zweiseitiges Konfidenzintervall lautet

wobei

der Stichprobenmittelwert, s die Standardabweichung der Stichprobe, n der Stichprobenumfang, 1-a das gewünschte Konfidenzniveau unddas 100(1-a/2)-Perzentil der Student’s t-Verteilung mit n-1 Freiheitsgraden ist.

Für eine Formel zur Berechnung eines Vorhersageintervalls muss lediglich ein zusätzlicher Term hinzugefügt werden, um die Variabilität einer einzelnen Beobachtung um den Mittelwert zu berücksichtigen. Diese Variabilität wird berücksichtigt, indem 1 zu dem 1/n-Term unter dem Quadratwurzelsymbol in Gleichung 2 addiert wird. Auf diese Weise erhält man die Formel für das Vorhersageintervall bei normalverteilten Daten:

Als Beispiel wollen wir uns noch einmal das pH-Beispiel aus Teil I dieser Serie ansehen. Aus dem pH-Beispiel haben wir folgende Daten:

Der Analytiker möchte auf der Grundlage der bisher gesammelten Stichproben das zweiseitige Intervall kennen, in dem eine einzelne zukünftige pH-Beobachtung mit einer gewissen Wahrscheinlichkeit liegen wird. Der durchschnittliche pH-Wert,

, beträgt in diesem Beispiel 6,52; die Standardabweichung der Probe, s, ist 0,11. Das gewählte Konfidenzniveau beträgt 95 % (a=0,05)

Abbildung 2: Normales Wahrscheinlichkeitsdiagramm für pH-Daten.

Im Gegensatz zu Konfidenzintervallen, die sich nur mit dem Zentrum der Populationsverteilung befassen, berücksichtigen Vorhersageintervalle sowohl die Schwänze der Verteilung als auch das Zentrum. Infolgedessen reagieren Prognoseintervalle empfindlicher auf die Normalitätsannahme als Konfidenzintervalle, weshalb die Normalitätsannahme vor der Berechnung eines Prognoseintervalls geprüft werden sollte. Die Normalitätsannahme kann mit einer geeigneten Statistiksoftware wie Minitab grafisch und quantitativ getestet werden. In diesem Beispiel gibt der Analytiker die Daten in Minitab ein, und es wird ein Normalwahrscheinlichkeitsdiagramm erstellt. Das Normalwahrscheinlichkeitsdiagramm ist in Abbildung 2 dargestellt.
Bei Betrachtung des Wahrscheinlichkeitsdiagramms wird deutlich, dass alle Daten innerhalb der 95% (1- a) Konfidenzintervalle liegen. Außerdem ist der P-Wert viel größer als das Signifikanzniveau von a = 0,05; daher würden wir die Annahme, dass die Daten normalverteilt sind, nicht verwerfen und können mit der Berechnung des Vorhersageintervalls fortfahren.

Um das Intervall zu berechnen, findet der Analyst zunächst den Wert

in einer veröffentlichten Tabelle mit kritischen Werten für die Student’s t-Verteilung bei dem gewählten Konfidenzniveau. In diesem Beispiel werden

Nachdem die Werte für

, s und n in Gleichung 3 eingesetzt, um das folgende Vorhersageintervall zu erhalten:

Das Intervall beträgt in diesem Fall 6,52 ± 0,26 oder 6,26 – 6,78. Die Interpretation des Intervalls ist, dass, wenn aufeinanderfolgende Proben aus der gleichen Population gezogen und getestet wurden, d.h., d.h. der gleichen Charge oder der gleichen Chargennummer, 95% der für die einzelnen Probensätze berechneten Intervalle voraussichtlich einen einzigen zukünftigen pH-Wert enthalten werden.

Wenn der Analytiker anstelle einer einzigen zukünftigen Beobachtung ein zweiseitiges Vorhersageintervall berechnen wollte, um eine Vielzahl zukünftiger Beobachtungen einzubeziehen, würde er einfach das t in Gl. 3 ändern. Es gibt zwar exakte Methoden zur Ableitung des Wertes für t für mehrere künftige Beobachtungen, in der Praxis ist es jedoch einfacher, das Niveau von t anzupassen, indem das Signifikanzniveau a durch die Anzahl der in das Vorhersageintervall einzubeziehenden mehreren künftigen Beobachtungen geteilt wird. Dies geschieht, um das gewünschte Signifikanzniveau über die gesamte Familie der zukünftigen Beobachtungen aufrechtzuerhalten. Anstatt also den Wert für

zu finden, würde man den Wert fürfinden, wobei k die Anzahl der zukünftigen Beobachtungen ist, die in das Vorhersageintervall einbezogen werden sollen.

Es gibt auch Situationen, in denen nur eine untere oder obere Grenze von Interesse ist. Nehmen wir zum Beispiel ein Akzeptanzkriterium, das nur verlangt, dass eine physikalische Eigenschaft eines Materials einen Mindestwert erreicht oder überschreitet, ohne dass eine Obergrenze für den Wert der physikalischen Eigenschaft festgelegt ist. In solchen Fällen würde der Analytiker ein einseitiges Intervall berechnen wollen. Um ein einseitiges Intervall zu berechnen, würde der Analytiker einfach die 2 aus dem Divisor entfernen; somit würde

zuundzuwerden.

Vorhersageintervall für Regression

Wir wenden uns nun der Anwendung von Vorhersageintervallen in der linearen Regressionsstatistik zu. In der linearen Regressionsstatistik definiert ein Vorhersageintervall einen Bereich von Werten, in den eine Antwort bei einem bestimmten Wert eines Prädiktors wahrscheinlich fällt. Lineare Regressionsdaten sind per Definition nicht normalverteilt. Normalverteilte Daten sind statistisch unabhängig voneinander, während regressierte Daten von einem Prädiktorwert abhängig sind, d. h. der Wert von Y hängt vom Wert von X ab. Aufgrund dieser Abhängigkeit sind Vorhersageintervalle für lineare Regressionsstatistiken wesentlich aufwändiger zu berechnen als Vorhersageintervalle für normalverteilte Daten.

Die durch ein Vorhersageintervall dargestellte Unsicherheit umfasst nicht nur die mit dem Populationsmittelwert und der neuen Beobachtung verbundenen Unsicherheiten (Variation), sondern auch die mit den Regressionsparametern verbundene Unsicherheit. Da die mit dem Populationsmittelwert und der neuen Beobachtung verbundenen Unsicherheiten unabhängig von den Beobachtungen sind, die zur Anpassung des Modells verwendet werden, müssen die Unsicherheitsschätzungen unter Verwendung der Wurzelsumme der Quadrate kombiniert werden, um die Gesamtunsicherheit zu erhalten,

. Die von den Regressionsparametern beigetragene Variation wird alsbezeichnet, die von der Schätzung des Populationsmittelwerts beigetragene Variation alsund die von der neuen Messung beigetragene Variation als s , die Gesamtvariation,, ist definiert als:

Wobei

in Bezug auf die Prädiktoren unter Verwendung der folgenden Beziehung ausgedrückt wird:

Addiert man Gl. 5 zu den beiden anderen Termen unter der Quadratwurzel in Gl. 3, so erhält man die zweiseitige Vorhersageintervallformel für die regressierte Antwortvariable

. Der „Hut“ über y zeigt an, dass es sich bei der Variable um eine Schätzung aufgrund der Unsicherheit der Regressionsparameter handelt, und die tiefgestellte 0 ist eine Indexzahl, die anzeigt, dass y die erste geschätzte Antwortvariable ist.

Die Auswertung von Gleichung 6 erfolgt am besten mit Hilfe der Varianzanalyse (ANOVA). Im Folgenden wird die Abfolge der Schritte beschrieben, die zur Berechnung eines Vorhersageintervalls für eine regressierte Antwortvariable bei einem bestimmten Wert eines Prädiktors durchgeführt werden können.

1. Bereiten Sie eine Tabelle mit Rohdaten vor und berechnen Sie die Durchschnittswerte

2. Bereiten Sie eine Summentabelle vor

3. Berechnen Sie die Steigung und den Achsenabschnitt der regressierten Daten

Die Gleichungen in Schritt 3 stellen die Regressionsparameter dar, d.h. die Steigung und den Achsenabschnitt, die die beste Anpassungslinie für die Daten definieren. Das Vorhersageintervall für die geschätzte Antwortvariable,

, muss bei einem bestimmten x unter Verwendung der Beziehungausgewertet werden. Das Vorhersageintervall klammert dann die geschätzte Antwort bei dem angegebenen Wert von x ein.

Berechnen Sie die Summe der Quadrate und Fehlerterme

4. Berechnen Sie das Vorhersageintervall, das ein einzelnes

bei x enthalten soll

Angenommen, ein Analytiker hat Rohdaten für einen Prozess gesammelt, und es wird vermutet, dass eine lineare Beziehung zwischen einer mit x bezeichneten Vorhersagevariablen und einer mit

bezeichneten Antwortvariablen besteht. Der Analytiker möchte mit 95-prozentiger Sicherheit wissen, in welchen Bereich ein Wert fürbei einem beliebigen Wert von x wahrscheinlich fällt. Die Rohdaten werden im Folgenden dargestellt.

Nach dem oben beschriebenen ANOVA-Verfahren berechnet der Analytiker zunächst den Mittelwert der Prädiktorvariablen x und der Antwortvariablen

.

Nächstens erstellt der Analytiker eine Summentabelle.

Nach Fertigstellung der Summentabelle fährt der Analytiker fort, die Steigung

, den Achsenabschnitt, die Gesamtsumme der Quadrate (SSTotal), die Summe der Quadrate der Residuen (SSResiduals), die Summe der Quadrate des Fehlers (SSError) und den Fehler (Se) für die Daten zu berechnen.

Als Nächstes berechnet der Analytiker den Wert der Antwortvariablen

bei dem gewünschten Wert der Prädiktorvariablen x. In diesem Fall ist der gewünschte Prädiktorwert 5.

Bevor er nun das Vorhersageintervall berechnet, wäre es ratsam, dass der Analytiker die Rohdaten zusammen mit der durch

definierten vorhergesagten Antwort in einem Streudiagramm darstellt, um die lineare Beziehung zu überprüfen. Wenn die Daten tatsächlich linear sind, sollten sie sich eng entlang der Trendlinie bewegen, wobei etwa die Hälfte der Punkte oberhalb und die Hälfte der Punkte unterhalb der Trendlinie liegt (siehe Abbildung 3). Daten, die sich nicht eng an der Trendlinie orientieren, deuten darauf hin, dass die lineare Beziehung schwach ist oder die Beziehung nicht linear ist und ein anderes Modell erforderlich ist, um eine angemessene Anpassung zu erzielen. In diesem Fall sollte die Berechnung eines Vorhersageintervalls nicht versucht werden, bis ein geeigneteres Modell gefunden ist. Auch wenn die Beziehung stark linear ist, sollte eine Normalwahrscheinlichkeitsdarstellung der Residuen einen P-Wert ergeben, der viel größer ist als das gewählte Signifikanzniveau (ein Signifikanzniveau von 0,05 ist typisch). Die Residuen können leicht berechnet werden, indem man die tatsächlichen Antwortwerte von den vorhergesagten Werten subtrahiert und eine Normalwahrscheinlichkeitsdarstellung der Residuen erstellt (siehe Abbildung 4).

Abbildung 3: Streudiagramm, das die linear-regressierte Trendlinie für die geschätzte Antwort zeigt.
Abbildung 4: Normalwahrscheinlichkeitsdarstellung der Residuen. Die einzelnen Residuenwerte liegen gut innerhalb der 1-a-Konfidenzintervallbänder und der P-Wert ist viel größer als das Signifikanzniveau von a=0,05; daher würden wir die Annahme, dass die Residuen normalverteilt sind, nicht verwerfen und können mit der Berechnung des Vorhersageintervalls fortfahren.

Nach der Feststellung der linearen Beziehung zwischen den Prädiktor- und Antwortvariablen und der Überprüfung der Annahme, dass die Residuen normalverteilt sind, kann der Analyst das Vorhersageintervall berechnen. Er beginnt damit, den Wert für die Student’s t-Verteilung zu finden, der einem Konfidenzniveau von 95 % entspricht (d. h. a=0,05). Da der Analyst an einem zweiseitigen Intervall interessiert ist, muss a durch 2 geteilt werden. Der korrekte Wert für t ist in diesem Fall, da a/2=0,025 und n-2 = 8, 2,306.

Mit dem korrekten Wert für

in der Hand berechnet der Analyst das Intervall unter Verwendung von Gleichung 6 und dem Vorhersagewert von 5.

Abbildung 5 zeigt das Streudiagramm aus Abbildung 3, wobei die berechneten oberen und unteren Grenzen des Vorhersageintervalls hinzugefügt wurden.

Abbildung 5: Streudiagramm mit den Grenzen des Vorhersageintervalls für die geschätzte Reaktion, . Der Prädiktorwert ist in diesem Fall 5.

Das Intervall, das den vorhergesagten Wert für y bei x=5 mit 95-prozentiger Sicherheit enthalten soll, beträgt also 19,15 – 32,07. Dieses Verfahren muss für andere Werte von x wiederholt werden, da die mit den geschätzten Parametern verbundene Variation möglicherweise nicht über den gesamten Vorhersagebereich konstant ist. Beispielsweise können die berechneten Vorhersageintervalle bei niedrigeren Werten für x kleiner und bei höheren Werten von x größer sein.

Diese Methode zur Berechnung eines Vorhersageintervalls für linear regressierte Daten funktioniert nicht für nichtlineare Beziehungen. In diesen Fällen müssen die Daten transformiert werden, um eine lineare Beziehung nachzuahmen, oder es müssen andere statistische Verteilungen zur Modellierung der Daten verwendet werden. Diese Methoden sind in den meisten statistischen Softwarepaketen verfügbar, ihre Erläuterung würde jedoch den Rahmen dieses Artikels sprengen.

Schlussfolgerung

Vorhersageintervalle bieten ein Mittel zur Quantifizierung der Unsicherheit einer einzelnen zukünftigen Beobachtung aus einer Population, vorausgesetzt, die zugrunde liegende Verteilung ist normal. Vorhersageintervalle können für normalverteilte Daten erstellt werden, eignen sich aber am besten für die Quantifizierung der Unsicherheit, die mit einer vorhergesagten Reaktion in der linearen Regressionsstatistik verbunden ist. Da Vorhersageintervalle sowohl die einzelnen Beobachtungen in einer Population als auch die Parameterschätzungen betreffen, sind Vorhersageintervalle notwendigerweise breiter als ein für denselben Datensatz berechnetes Konfidenzintervall. Aus demselben Grund sind Vorhersageintervalle auch anfälliger für die Normalitätsannahme als Konfidenzintervalle.

Im dritten Teil dieser Reihe werden wir ein Intervall untersuchen, das einen bestimmten Anteil der Grundgesamtheit mit einer gegebenen Konfidenz abdeckt. Diese Art von Intervall wird als Toleranzintervall bezeichnet und ist besonders nützlich, wenn das Ziel darin besteht, die Fähigkeit eines Prozesses nachzuweisen, bestimmte Leistungsanforderungen zu erfüllen, wie z. B. Spezifikationsgrenzen im Zusammenhang mit einem kritischen Qualitätsmerkmal eines Produkts.

Erfahren Sie mehr über die Prozessvalidierungsdienste der ProPharma Group.
Kontaktieren Sie uns, um mit Fred und unseren anderen Fachexperten für eine maßgeschneiderte Prozessvalidierungslösung Kontakt aufzunehmen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.