Pochopení statistických intervalů: část 2 – Predikční intervaly | ProPharma Group Pochopení statistických intervalů:

V 1. části tohoto seriálu jsme se zabývali intervaly spolehlivosti. Intervaly spolehlivosti jsou nejznámější ze statistických intervalů, ale ohraničují pouze oblasti spojené s parametry populace; tj. střední hodnotu nebo směrodatnou odchylku populace. Co když nás místo průměru nebo směrodatné odchylky zajímají jednotlivá pozorování z populace? K tomu můžeme využít predikční interval.

Predikční intervaly představují nejistotu předpovědi hodnoty jednoho budoucího pozorování nebo pevného počtu více budoucích pozorování z populace na základě rozdělení nebo rozptylu řady předchozích pozorování. Podobně jako interval spolehlivosti by intervaly predikce vypočtené z jednoho vzorku neměly být interpretovány tak, že určité procento budoucích pozorování bude vždy obsaženo v intervalu; interval predikce by měl být spíše interpretován tak, že při výpočtu pro řadu po sobě jdoucích vzorků z téže populace bude interval predikce obsahovat budoucí pozorování v určitém procentu případů.

Například: pokud shromáždíme vzorek pozorování a na základě tohoto vzorku vypočítáme 95% predikční interval, existuje 95% pravděpodobnost, že budoucí pozorování bude obsaženo v predikčním intervalu. A naopak, existuje také 5% pravděpodobnost, že příští pozorování nebude v tomto intervalu obsaženo. Pokud shromáždíme 20 vzorků a pro každý z nich vypočítáme interval předpovědi, můžeme očekávat, že 19 z vypočtených intervalů bude obsahovat jedno budoucí pozorování, zatímco 1 z vypočtených intervalů nebude obsahovat ani jedno budoucí pozorování. Tato interpretace předpovědního intervalu je graficky znázorněna na obrázku 1.

Obrázek 1. Graf horní a dolní hranice předpovědního intervalu pro 20 vzorků, z nichž každý se skládá z 10 měření pH vybraných ze stejné populace. Graf zahrnuje také 20 jednotlivých budoucích pozorování. Všimněte si, že 1 z 20 jednotlivých budoucích měření pH (zakroužkované červeně) je mimo příslušnou oblast předpovědního intervalu. To je v souladu s 5 % intervalů, u kterých se neočekává, že budou obsahovat jediné budoucí pozorování pro hladinu spolehlivosti 95 %.

Předpovědní intervaly se nejčastěji používají v regresní statistice, ale lze je použít i u normálně rozložených dat. Výpočet predikčního intervalu pro normálně rozložená data je mnohem jednodušší než výpočet potřebný pro regresní data, proto začneme u nich.

Predikční interval pro normální data

Vzorce pro predikční interval je téměř totožný se vzorcem pro výpočet intervalu spolehlivosti. Připomeňme si, že vzorec pro oboustranný interval spolehlivosti je

kde

je výběrový průměr, s je výběrová směrodatná odchylka, n je velikost vzorku, 1-a je požadovaná hladina spolehlivosti aje 100(1-a/2) percentil studentova t rozdělení s n-1 stupni volnosti.

Ve vzorci pro výpočet predikčního intervalu stačí přidat další člen, který zohlední variabilitu jednoho pozorování kolem průměru. Tato variabilita se zohlední přidáním 1 k členu 1/n pod symbolem odmocniny v rovnici 2. Tímto postupem získáme vzorec pro predikční interval pro normálně rozdělená data:

Pro příklad se opět podívejme na příklad pH z první části tohoto seriálu. Z příkladu pH máme následující data:

Analytička chce na základě dosud shromážděných vzorků znát oboustranný interval, v němž bude s určitou mírou spolehlivosti pravděpodobně ležet jedno budoucí pozorování pH. Průměrné pH,

, v tomto příkladu je 6,52; směrodatná odchylka vzorku, s, je 0,11. Zvolená hladina spolehlivosti je 95 % (a=0,05)

Obrázek 2: Normální pravděpodobnostní graf pro data pH.

Na rozdíl od intervalů spolehlivosti, které se zabývají pouze středem populačního rozdělení, předpovědní intervaly berou v úvahu ocasy rozdělení i střed. V důsledku toho jsou predikční intervaly citlivější na předpoklad normality než intervaly spolehlivosti, a proto by se měl předpoklad normality před výpočtem predikčního intervalu testovat. Předpoklad normality lze testovat graficky a kvantitativně pomocí vhodného statistického softwaru, například Minitab. V tomto příkladu analytik zadá data do programu Minitab a vytvoří graf normální pravděpodobnosti. Normální pravděpodobnostní graf je znázorněn na obrázku 2.
Při pohledu na pravděpodobnostní graf vidíme, že všechna data spadají do pásma 95% (1- a) konfidenčního intervalu. Navíc hodnota P je mnohem větší než hladina významnosti a = 0,05; proto bychom předpoklad, že data jsou normálně rozdělena, nezamítli a můžeme přistoupit k výpočtu předpovědního intervalu.

Pro výpočet intervalu analytik nejprve najde hodnotu

v publikované tabulce kritických hodnot pro studentovo t rozdělení při zvolené hladině spolehlivosti. V tomto příkladu,

Následující hodnoty pro

, s a n se zadají do rovnice 3, čímž se získá následující interval předpovědi:

Interval je v tomto případě 6,52 ± 0,26 nebo, 6,26 – 6,78. Interpretace tohoto intervalu je taková, že pokud by byly po sobě jdoucí vzorky vytaženy a testovány ze stejné populace; tj, stejné šarže nebo stejného čísla šarže, očekává se, že 95 % intervalů vypočtených pro jednotlivé soubory vzorků bude obsahovat jediné další budoucí měření pH.

Pokud by analytik chtěl místo jediného budoucího pozorování vypočítat oboustranný interval předpovědi, který by zahrnoval více budoucích pozorování, jednoduše by upravil t v rovnici. 3. I když existují přesné metody pro odvození hodnoty t pro více budoucích pozorování, v praxi je jednodušší upravit úroveň t vydělením hladiny významnosti, a, počtem více budoucích pozorování, která mají být zahrnuta do předpovědního intervalu. To se provádí proto, aby se zachovala požadovaná hladina významnosti pro celou skupinu budoucích pozorování. Takže místo hledání hodnoty pro

bychom hledali hodnotu pro, kde k je počet budoucích pozorování, která mají být zahrnuta do předpovědního intervalu.

Existují také situace, kdy nás zajímá pouze dolní nebo horní mez. Vezměme si například kritérium přijatelnosti, které vyžaduje pouze to, aby fyzikální vlastnost materiálu splňovala nebo překračovala minimální hodnotu bez horní hranice hodnoty této fyzikální vlastnosti. V těchto případech by analytik chtěl vypočítat jednostranný interval. Pro výpočet jednostranného intervalu by analytik jednoduše odstranil dvojku z dělitele; z

by se tedy staloa zby se stalo.

Predikční interval pro regresi

Přejdeme nyní k použití predikčních intervalů v lineární regresní statistice. V lineární regresní statistice predikční interval definuje rozsah hodnot, do kterého pravděpodobně spadá odpověď při zadané hodnotě prediktoru. Lineárně regresovaná data jsou z definice nenormálně rozdělena. Normálně rozdělená data jsou na sobě statisticky nezávislá, zatímco regresní data jsou závislá na hodnotě prediktoru, tj. hodnota Y je závislá na hodnotě X. Kvůli této závislosti je výpočet predikčních intervalů aplikovaných v lineární regresní statistice podstatně náročnější než výpočet predikčních intervalů pro normálně rozdělená data.

Nejistota reprezentovaná predikčním intervalem zahrnuje nejen nejistoty (odchylky) spojené s populačním průměrem a novým pozorováním, ale také nejistoty spojené s regresními parametry. Protože nejistoty spojené s populačním průměrem a novým pozorováním jsou nezávislé na pozorováních použitých k fitování modelu, musí se odhady nejistot kombinovat pomocí kořenového součtu čtverců, aby se získala celková nejistota,

. Označíme-li odchylku, ke které přispívají regresní parametry, jako, odchylku, ke které přispívá odhad populačního průměru, jakoa odchylku, ke které přispívá nové měření, jako s , je celková odchylka,definována jako:

Kde

je vyjádřena z hlediska prediktorů pomocí následujícího vztahu:

Přičtením rovnice 5 k dalším dvěma členům pod odmocninou ve rovnici 3 získáme vzorec pro oboustranný predikční interval pro regresovanou proměnnou odezvy

. Klobouček“ nad y označuje, že proměnná je odhadem v důsledku nejistoty regresních parametrů, a index 0 je indexové číslo označující, že y je první odhadovaná proměnná odezvy.

Vyhodnocení rovnice 6 se nejlépe provádí pomocí analýzy rozptylu (ANOVA). Níže je uvedena posloupnost kroků, které lze provést pro výpočet predikčního intervalu pro regresovanou proměnnou odezvy při zadané hodnotě prediktoru.

1. Připravte tabulku nezpracovaných dat a vypočítejte průměry

2. Připravte tabulku součtů

3. Vypočítejte sklon a průsečík regresovaných dat

Rovnice v kroku 3 představují regresní parametry; tj. sklon a průsečík definující nejlépe odpovídající přímku pro data. Interval předpovědi pro odhadovanou proměnnou odezvy,

, musí být vyhodnocen při zadaném x pomocí vztahu. Predikční interval pak uzavírá odhadovanou odezvu při zadané hodnotě x.

Vypočítejte součet čtverců a chybových členů

4. Vypočítejte predikční interval tak, aby obsahoval jedinou

danou x

Předpokládejme například, že analytik shromáždil nezpracované údaje o procesu a předpokládá se, že existuje lineární vztah mezi predikční proměnnou označenou x a odezvou označenou

. Analytik chce znát s 95% spolehlivostí oblast, do které pravděpodobně spadá hodnotapři libovolné hodnotě x. Níže jsou uvedena nezpracovaná data.

Podle výše uvedeného postupu ANOVA analytik nejprve vypočítá střední hodnotu jak prediktivní proměnné x, tak proměnné odpovědi

.

Poté analytik připraví tabulku součtů.

Po vyplnění tabulky součtů analytik přistoupí k výpočtu sklonu

, interceptu, celkového součtu čtverců (SSTotal), součtu čtverců reziduí (SSResiduals), součtu čtverců chyb (SSError) a chyby (Se) pro data.

Dále analytik vypočítá hodnotu proměnné odezvy,

, při požadované hodnotě proměnné prediktoru, x. V tomto případě je požadovaná hodnota prediktoru 5.

Nyní, před výpočtem predikčního intervalu, by bylo moudré, aby analytik vynesl surová data spolu s predikovanou odezvou definovanou

na graf rozptylu, aby ověřil lineární vztah. Pokud je skutečně lineární, měla by data sledovat těsně podél trendové přímky s přibližně polovinou bodů nad a polovinou bodů pod ní (viz obrázek 3). Data, která nesledují těsně kolem trendové přímky, naznačují, že lineární vztah je slabý nebo že vztah je nelineární a k získání odpovídající shody je třeba použít nějaký jiný model. V takovém případě by se výpočet predikčního intervalu neměl provádět, dokud nebude nalezen vhodnější model. Také pokud je vztah silně lineární, měl by normální pravděpodobnostní graf reziduí poskytnout hodnotu P mnohem vyšší než zvolená hladina významnosti (typická hladina významnosti je 0,05). Rezidua lze snadno vypočítat odečtením skutečných hodnot odezvy od předpovězených hodnot a sestavením normálního pravděpodobnostního grafu reziduálních hodnot (viz obrázek 4).

Obr. 3: Graf rozptylu znázorňující lineárně regresní trendovou linii pro odhadovanou odezvu.
Obr. 4: Normální pravděpodobnostní graf reziduí. Jednotlivé hodnoty reziduí se nacházejí v pásmech intervalu spolehlivosti 1-a a hodnota P je mnohem větší než hladina významnosti a=0,05; proto bychom nezamítli předpoklad, že rezidua jsou normálně rozdělena, a můžeme pokračovat ve výpočtu predikčního intervalu.

Po zjištění lineárního vztahu mezi proměnnými prediktoru a odpovědi a ověření předpokladu, že rezidua jsou normálně rozdělena, je analytik připraven vypočítat predikční interval. Analytik začne tím, že nejprve zjistí hodnotu pro Studentovo t rozdělení odpovídající 95% hladině spolehlivosti (tj. a=0,05). Protože analytika zajímá oboustranný interval, musí a vydělit 2. Správná hodnota pro t v tomto případě vzhledem k tomu, že a/2=0,025 a n-2 = 8, je 2,306.

S tím, že má v ruce správnou hodnotu pro

, vypočítá analytik interval pomocí rovnice 6 a hodnoty prediktoru 5. V tomto případě je správná hodnota pro.

Obrázek 5 ukazuje graf rozptylu z obrázku 3 s přidanými horními a dolními hranicemi vypočteného predikčního intervalu.

Obrázek 5: Graf rozptylu s hranicemi predikčního intervalu pro odhadovanou odpověď, . Hodnota prediktoru je v tomto případě 5.

Očekávaný interval obsahující predikovanou hodnotu pro y při x=5 s 95% spolehlivostí je tedy 19,15 – 32,07. Tento postup je třeba opakovat pro jiné hodnoty x, protože odchylka spojená s odhadovanými parametry nemusí být v celém rozsahu prediktoru konstantní. Například vypočtené predikční intervaly mohou být menší při nižších hodnotách x a větší při vyšších hodnotách x.

Tato metoda výpočtu predikčního intervalu pro lineárně regresovaná data nefunguje pro nelineární vztahy. Tyto případy vyžadují transformaci dat tak, aby napodobovala lineární vztah, nebo použití jiných statistických rozdělení k modelování dat. Tyto metody jsou k dispozici ve většině statistických softwarových balíků, ale vysvětlení těchto metod je nad rámec tohoto článku.

Závěr

Předpovědní intervaly poskytují prostředek pro kvantifikaci nejistoty jednoho budoucího pozorování z populace za předpokladu, že základní rozdělení je normální. Predikční intervaly lze vytvořit pro normálně rozdělená data, ale nejlépe se hodí pro kvantifikaci nejistoty spojené s predikovanou odpovědí v lineární regresní statistice. Protože se predikční intervaly týkají jak jednotlivých pozorování v populaci, tak odhadů parametrů, budou predikční intervaly nutně širší než interval spolehlivosti vypočítaný pro stejný soubor dat. Ze stejného důvodu jsou predikční intervaly také náchylnější k předpokladu normality než intervaly spolehlivosti.

V části-III tohoto seriálu se budeme zabývat intervalem, který má pokrýt určitou část populace s danou spolehlivostí. Tento typ intervalu se nazývá toleranční interval a je užitečný zejména tehdy, když je cílem prokázat schopnost procesu splnit specifikované požadavky na výkonnost, například specifikační limity spojené s kritickou charakteristikou kvality produktu.

Zjistěte více o službách společnosti ProPharma Group v oblasti validace procesů.
Kontaktujte nás a kontaktujte Freda a další naše odborníky na danou problematiku, abyste získali řešení validace procesů na míru.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.