Inzicht in statistische intervallen: Part 2 - Prediction Intervals | ProPharma Group

In deel 1 van deze serie werden betrouwbaarheidsintervallen besproken. Betrouwbaarheidsintervallen zijn de bekendste van de statistische intervallen, maar ze begrenzen alleen regio’s die geassocieerd zijn met populatieparameters; d.w.z. het gemiddelde of de standaardafwijking van een populatie. Wat als we in plaats van het gemiddelde of de standaardafwijking geïnteresseerd zijn in individuele waarnemingen uit een populatie? Daarvoor kunnen we gebruik maken van het voorspellingsinterval.

Voorspellingsintervallen geven de onzekerheid weer van het voorspellen van de waarde van een enkele toekomstige waarneming of een vast aantal meerdere toekomstige waarnemingen uit een populatie op basis van de verdeling of spreiding van een aantal eerdere waarnemingen. Vergelijkbaar met het betrouwbaarheidsinterval, moeten voorspellingsintervallen berekend op basis van een enkele steekproef niet worden geïnterpreteerd om te betekenen dat een gespecificeerd percentage toekomstige waarnemingen altijd binnen het interval zal liggen; eerder moet een voorspellingsinterval worden geïnterpreteerd om te betekenen dat wanneer berekend voor een aantal opeenvolgende steekproeven uit dezelfde populatie, een voorspellingsinterval een gespecificeerd percentage van de tijd een toekomstige waarneming zal bevatten.

Bij voorbeeld: indien wij een steekproef van waarnemingen verzamelen en op basis van die steekproef een voorspellingsinterval van 95% berekenen, is er een kans van 95% dat een toekomstige waarneming binnen het voorspellingsinterval zal liggen. Omgekeerd is er ook een kans van 5% dat de volgende waarneming niet in het interval zal liggen. Indien wij 20 steekproeven verzamelen en voor elk daarvan een voorspellingsinterval berekenen, kunnen wij verwachten dat 19 van de berekende intervallen één enkele toekomstige waarneming zullen bevatten, terwijl 1 van de berekende intervallen geen enkele toekomstige waarneming zal bevatten. Deze interpretatie van het voorspellingsinterval wordt grafisch weergegeven in figuur 1.

Figuur 1. Grafiek 1. Uitzetten van de boven- en ondergrens van het voorspellingsinterval voor 20 monsters van elk 10 pH-metingen uit dezelfde populatie. De grafiek omvat ook 20 afzonderlijke toekomstige waarnemingen. Merk op dat 1 van de 20 enkele toekomstige pH-metingen (rood omcirkeld) buiten het bijbehorende voorspellingsintervalgebied ligt. Dit komt overeen met de 5% van de intervallen die naar verwachting geen enkele toekomstige waarneming zullen bevatten bij een betrouwbaarheidsniveau van 95%.

Voorspellingsintervallen worden het meest gebruikt in regressiestatistieken, maar kunnen ook worden gebruikt bij normaal verdeelde gegevens. De berekening van een voorspellingsinterval voor normaal verdeelde gegevens is veel eenvoudiger dan die voor regressiegegevens, zodat we daar zullen beginnen.

Voorspellingsinterval voor normale gegevens

De formule voor een voorspellingsinterval is bijna identiek aan de formule die wordt gebruikt om een betrouwbaarheidsinterval te berekenen. Herinner u dat de formule voor een tweezijdig betrouwbaarheidsinterval is

waar

het steekproefgemiddelde is, s de standaardafwijking van de steekproef is, n de steekproefgrootte is, 1-a het gewenste betrouwbaarheidsniveau is, enhet 100(1-a/2) percentiel van de t-verdeling van de student is met n-1 vrijheidsgraden.

Het enige dat nodig is voor een formule om een voorspellingsinterval te berekenen is een extra term toe te voegen om rekening te houden met de variabiliteit van een enkele waarneming ten opzichte van het gemiddelde. Deze variabiliteit wordt berekend door 1 toe te voegen aan de 1/n term onder het vierkantswortelteken in Eq 2. Dit levert de voorspellingsintervalformule op voor normaal verdeelde gegevens:

Laten we als voorbeeld nog eens kijken naar het pH-voorbeeld uit deel I van deze reeks. Uit het pH-voorbeeld hebben we de volgende gegevens:

De analist wil, op basis van de tot nu toe verzamelde monsters, het tweezijdige interval weten waarbinnen een enkele toekomstige pH-waarneming waarschijnlijk zal liggen met een zekere mate van betrouwbaarheid. De gemiddelde pH,

, is in dit voorbeeld 6,52; de standaardafwijking van de steekproef, s, is 0,11. Het gekozen betrouwbaarheidsniveau is 95% (a=0,05)

Figuur 2: Normale waarschijnlijkheidsplot voor pH-gegevens.

In tegenstelling tot betrouwbaarheidsintervallen die alleen betrekking hebben op het centrum van de populatieverdeling, houden voorspellingsintervallen niet alleen rekening met het centrum, maar ook met de staarten van de verdeling. Bijgevolg zijn voorspellingsintervallen gevoeliger voor de normaliteitsveronderstelling dan betrouwbaarheidsintervallen en moet de normaliteitsveronderstelling worden getest alvorens een voorspellingsinterval te berekenen. De normaliteitsveronderstelling kan grafisch en kwantitatief worden getest met behulp van geschikte statistische software, zoals Minitab. Voor dit voorbeeld voert de analist de gegevens in Minitab in en wordt een normale waarschijnlijkheidsplot gegenereerd. De normale waarschijnlijkheidsplot is weergegeven in figuur 2.
Als we naar de waarschijnlijkheidsplot kijken, zien we dat alle gegevens binnen de 95%-band (1- a) van het betrouwbaarheidsinterval vallen. Bovendien is de P-waarde veel groter dan het significantieniveau van a = 0,05; daarom verwerpen we de aanname dat de gegevens normaal verdeeld zijn niet en kunnen we doorgaan met het berekenen van het voorspellingsinterval.

Om het interval te berekenen zoekt de analist eerst de waarde

in een gepubliceerde tabel met kritieke waarden voor de t-verdeling van de student bij het gekozen betrouwbaarheidsniveau. In dit voorbeeld worden

Naar aanleiding van de waarden voor

, s, en n in Eqn. 3 ingevoerd om het volgende voorspellingsinterval te verkrijgen:

Het interval is in dit geval 6,52 ± 0,26 of, 6,26 – 6,78. De interpretatie van het interval is dat indien opeenvolgende monsters uit dezelfde populatie worden getrokken en getest, d.w.z, dezelfde batch of hetzelfde lotnummer, 95% van de intervallen berekend voor de afzonderlijke sets monsters naar verwachting één enkele volgende toekomstige pH-waarde zal bevatten.

Wenst de analist in plaats van één enkele toekomstige waarneming een tweezijdig voorspellingsinterval te berekenen dat een veelvoud van toekomstige waarnemingen omvat, dan zou de analist eenvoudig de t in Eqn. 3. Hoewel er exacte methoden bestaan om de waarde voor t voor meervoudige toekomstige waarnemingen af te leiden, is het in de praktijk eenvoudiger om het niveau van t aan te passen door het significantieniveau, a, te delen door het aantal meervoudige toekomstige waarnemingen dat in het voorspellingsinterval moet worden opgenomen. Dit wordt gedaan om het gewenste significantieniveau over de hele familie van toekomstige waarnemingen te handhaven. Dus in plaats van de waarde voor

te vinden, zouden wij de waarde voorvinden, waarbij k het aantal toekomstige waarnemingen is dat in het voorspellingsinterval moet worden opgenomen.

Er zijn ook situaties waarin alleen een ondergrens of een bovengrens van belang is. Neem bijvoorbeeld een aanvaardingscriterium waarbij een fysische eigenschap van een materiaal slechts aan een minimumwaarde moet voldoen of deze overschrijden, zonder bovengrens voor de waarde van de fysische eigenschap. In deze gevallen zou de analist een eenzijdig interval willen berekenen. Om een eenzijdig interval te berekenen zou de analist eenvoudig de 2 uit de deler verwijderen; dus

zouworden enzouworden.

Voorspellingsinterval voor regressie

We gaan nu over tot de toepassing van voorspellingsintervallen in lineaire regressiestatistieken. In de lineaire regressiestatistiek definieert een voorspellingsinterval een reeks van waarden waarbinnen een respons waarschijnlijk zal vallen gegeven een gespecificeerde waarde van een voorspeller. Lineair verdeelde gegevens zijn per definitie niet-normaal verdeeld. Normaal verdeelde gegevens zijn statistisch onafhankelijk van elkaar, terwijl regressieve gegevens afhankelijk zijn van een voorspellende waarde; d.w.z. de waarde van Y is afhankelijk van de waarde van X. Wegens deze afhankelijkheid zijn voorspellingsintervallen voor lineaire regressiestatistieken aanzienlijk moeilijker te berekenen dan voorspellingsintervallen voor normaal verdeelde gegevens.

De onzekerheid die door een voorspellingsinterval wordt weergegeven omvat niet alleen de onzekerheden (variatie) die met het populatiegemiddelde en de nieuwe waarneming zijn verbonden, maar ook de onzekerheid die met de regressieparameters is verbonden. Omdat de onzekerheden die samenhangen met het populatiegemiddelde en de nieuwe waarneming onafhankelijk zijn van de waarnemingen die zijn gebruikt om het model te passen, moeten de onzekerheidsschattingen worden gecombineerd met behulp van de wortel-som-van-kwadraten om de totale onzekerheid,

, te verkrijgen. De variatie die door de regressieparameters wordt bijgedragen wordt, de variatie die door de schatting van het populatiegemiddelde wordt bijgedragen wordt, en de variatie die door de nieuwe meting wordt bijgedragen wordt s , zodat de totale variatie,, wordt gedefinieerd als:

Waar

wordt uitgedrukt in termen van de voorspellers met behulp van de volgende relatie:

Door Eqn. 5 toe te voegen aan de twee andere termen onder de vierkantswortel in Eqn. 3, ontstaat de tweezijdige voorspellingsintervalformule voor de geregresseerde responsvariabele

. De “hoed” boven de y geeft aan dat de variabele een schatting is ten gevolge van de onzekerheid van de regressieparameters en de 0 in subscript is een indexcijfer dat aangeeft dat y de eerste geschatte responsvariabele is.

De evaluatie van Eqn. 6 kan het best worden uitgevoerd met behulp van variantieanalyses (ANOVA). Hieronder wordt de opeenvolging van stappen beschreven die kunnen worden gevolgd om een voorspellingsinterval te berekenen voor een geregresseerde responsvariabele gegeven een gespecificeerde waarde van een voorspeller.

1. Maak een tabel met ruwe gegevens en bereken gemiddelden

2. Maak een tabel met sommen

3. Bereken de helling en het intercept van de regressieve gegevens

De vergelijkingen in stap 3 geven de regressieparameters weer; d.w.z. de helling en het intercept die de best passende lijn voor de gegevens bepalen. Het voorspellingsinterval voor de geschatte responsvariabele,

, moet bij een gespecificeerde x worden geëvalueerd met behulp van de relatie. Het voorspellingsinterval houdt dan de geschatte respons bij de gespecificeerde waarde van x aan.

Bereken de som van kwadraten en foutentermen

4. Bereken het voorspellingsinterval dat een enkele

moet bevatten, gegeven x

Voorbeeld: stel dat een analist ruwe gegevens voor een proces heeft verzameld en men vermoedt dat er een lineair verband bestaat tussen een voorspellende variabele, aangeduid door x, en een responsvariabele, aangeduid door

. De analist wil met een betrouwbaarheid van 95% weten in welk gebied een waarde voorwaarschijnlijk zal vallen, gegeven een willekeurige waarde van x. De onbewerkte gegevens worden hieronder weergegeven.

Volgens de hierboven geschetste ANOVA-procedure berekent de analist eerst het gemiddelde van zowel de voorspellende variabele, x, als de responsvariabele,

De analist stelt vervolgens een tabel met sommen op.

Na voltooiing van de tabel met sommen berekent de analist de helling

, de intercept, de totale som van kwadraten (SSTotal), de som van kwadraten van de restwaarden (SSResiduals), de som van kwadraten van de fout (SSError) en de fout (Se) voor de gegevens.

De analist berekent vervolgens de waarde van de responsvariabele,

, bij de gewenste waarde van de voorspellende variabele, x. In dit geval is de gewenste voorspellende waarde 5.

Nadat de analist het voorspellingsinterval gaat berekenen, doet hij er verstandig aan de ruwe gegevens samen met de voorspelde respons, gedefinieerd door

, op een spreidingsdiagram uit te zetten om het lineaire verband te controleren. Als de gegevens inderdaad lineair zijn, moeten zij dicht bij de trendlijn liggen met ongeveer de helft van de punten erboven en de helft eronder (zie figuur 3). Gegevens die niet nauw aansluiten bij de trendlijn geven aan dat het lineaire verband zwak is of dat het verband niet-lineair is en dat een ander model vereist is om een adequate fit te verkrijgen. In dit geval moet niet worden geprobeerd een voorspellingsinterval te berekenen totdat een adequater model is gevonden. Indien het verband sterk lineair is, moet een normale waarschijnlijkheidsplot van de residuen een P-waarde opleveren die veel groter is dan het gekozen significantieniveau (een significantieniveau van 0,05 is gebruikelijk). De residuen kunnen gemakkelijk worden berekend door de werkelijke responswaarden af te trekken van de voorspelde waarden en een normale waarschijnlijkheidsplot van de restwaarden te maken (zie figuur 4).

Figuur 3: Scatterplot met de lineair-gecorrigeerde trendlijn voor de geschatte respons.

Figuur 4: Normale waarschijnlijkheidsplot van de residuen. De afzonderlijke residuele waarden liggen ruim binnen de grenzen van het 1-a-betrouwbaarheidsinterval en de P-waarde is veel groter dan het significantieniveau van a=0,05; daarom verwerpen we de veronderstelling dat de residuen normaal verdeeld zijn niet en kunnen we doorgaan met de berekening van het voorspellingsinterval.

Nadat het lineaire verband tussen de voorspellende en de responsvariabelen is vastgesteld en de veronderstelling dat de residuen normaal verdeeld zijn, is gecontroleerd, is de analist klaar om het voorspellingsinterval te berekenen. De analist begint met het vinden van de waarde voor de t-verdeling van de student die overeenkomt met een betrouwbaarheidsniveau van 95% (d.w.z. a=0,05). Aangezien de analist geïnteresseerd is in een tweezijdig interval, moet a worden gedeeld door 2. De juiste waarde voor t in dit geval, gegeven dat a/2=0,025 en n-2 = 8, is 2,306.

Met de juiste waarde voor

in de hand, berekent de analist het interval met behulp van Eqn. 6 en de voorspellende waarde van 5.

Figuur 5 toont de spreidingsplot van figuur 3 met de berekende boven- en ondergrenzen van het voorspellingsinterval toegevoegd.

Figuur 5: Spreidingsplot met grenzen van het voorspellingsinterval voor de geschatte respons, . De voorspellende waarde is in dit geval 5.

Het interval dat naar verwachting de voorspelde waarde voor y bij x=5 met een betrouwbaarheid van 95% zal bevatten, is dus 19,15 – 32,07. Deze procedure moet voor andere waarden van x worden herhaald omdat de variatie die met de geschatte parameters samenhangt niet constant kan zijn over het gehele voorspellingsbereik. Zo kunnen de berekende voorspellingsintervallen kleiner zijn bij lagere waarden voor x en groter bij hogere waarden van x.

Deze methode voor het berekenen van een voorspellingsinterval voor lineair geregresseerde gegevens werkt niet voor niet-lineaire verbanden. In deze gevallen moeten de gegevens worden getransformeerd om een lineair verband na te bootsen of moeten andere statistische verdelingen worden toegepast om de gegevens te modelleren. Deze methoden zijn beschikbaar in de meeste statistische softwarepakketten, maar uitleg van deze methoden valt buiten het bestek van dit artikel.

Conclusie

Voorspellingsintervallen bieden een middel voor het kwantificeren van de onzekerheid van een enkele toekomstige waarneming uit een populatie, mits de onderliggende verdeling normaal is. Voorspellingsintervallen kunnen worden gecreëerd voor normaal verdeelde gegevens, maar zijn het meest geschikt voor het kwantificeren van de onzekerheid die samenhangt met een voorspelde respons in lineaire regressiestatistieken. Omdat voorspellingsintervallen zowel betrekking hebben op de individuele waarnemingen in een populatie als op de parameterschattingen, zullen voorspellingsintervallen noodzakelijkerwijs ruimer zijn dan een betrouwbaarheidsinterval dat voor dezelfde gegevensverzameling wordt berekend. Om dezelfde reden zijn voorspellingsintervallen ook gevoeliger voor de aanname van normaliteit dan betrouwbaarheidsintervallen.

In deel III van deze serie zullen wij een interval onderzoeken dat een gespecificeerd deel van de populatie bestrijkt met een gegeven betrouwbaarheid. Dit type interval wordt een Tolerantie Interval genoemd en is vooral nuttig wanneer het doel is om het vermogen van een proces aan te tonen om aan gespecificeerde prestatie-eisen te voldoen, zoals specificatiegrenzen die zijn gekoppeld aan een productkritisch kwaliteitskenmerk.

Lees meer over ProPharma Group’s Proces Validatie diensten.
Neem contact met ons op om in contact te komen met Fred en onze andere materiedeskundigen voor een op maat gemaakte Proces Validatie oplossing.

Understanding Statistical Intervals: Deel 2 – Voorspellingsintervallen

Geef een antwoord Antwoord annuleren