3.2 Kvalitativní aproximace s horní a dolní mírou a tranzitivní nerozlišitelnost
Psychologické úvahy o prahových hodnotách, pod nimiž jsou percepční nebo jiné srovnávací soudy obtížné, ne-li nemožné, inicioval Fechner. Důležitou ranou matematickou analýzu podal Wiener . Velká část moderní literatury začíná Luceovou definicí polopřímky, kterou Scott a Suppes axiomatizovali jako jedinou binární relaci v konečném případě . Některé z nejvýznamnějších příspěvků přinesl Falmagne .
Pravděpodobnostní analýza prahů se datuje přinejmenším od prací Thurstonea . Falmagne byl také ústředním přispěvatelem tohoto přístupu a spolu s kolegy napsal řadu dalších prací: Falmagne a Iverson , Falmagne a kol. a Iverson a Falmagne . Rozsáhlý přehled veškeré této literatury je uveden v Suppes et al., .
Téměř všechny uvedené práce předpokládají, že nerozlišitelnost podobných událostí, objektů nebo podnětů je nepřechodný vztah. Implicitně se předpokládá, že při mnoha různých rozlišujících pozorováních lze oddělit mnoho původně nerozlišitelných událostí. Zde je východiskem opak a důvodem použití slova „tranzitivní“ v názvu. Je to důsledek zavedených axiomů, že nerozlišitelnost je relace ekvivalence, a tedy tranzitivní. Zbytek tohoto oddílu do značné míry čerpá ze Suppese .
V předchozím oddílu jsem stručně zhodnotil rozsáhlé měření zaměřené na konstrukci konečné standardní reprezentace poměrového měřítka. Základ tranzitivní nerozlišitelnosti je nyní snadné vysvětlit. Vážený objekt je přiřazen k jedinečnému minimálnímu intervalu, například k intervalu mezi 1,9 g a 2,0 g. Binární vztah dvou objektů, a a b, které nejsou součástí standardní posloupnosti, jsou ekvivalentní co do váhy, a ≈ b, spočívá v tom, že jsou přiřazeny ke stejnému minimálnímu intervalu ve standardní posloupnosti. Tato relace je zjevně relací ekvivalence, tj, reflexivní, symetrická a tranzitivní, ale v rozvinutém systému aproximace nejsou tyto vlastnosti přímo testovatelné, ale spíše důsledkem váhových operací se standardními, již „kalibrovanými“ množinami vah.
Takže v později používaném zápisu je objekt přiřazený do minimálního intervalu (1.9 g, 2,0 g) se říká, že má jako aproximace horní míru (hmotnosti) w* (a) = 2,0 g a dolní míru w*(a) = 1,9 g. V praxi se u všech postupů měření kromě těch nejrafinovanějších žádná statistická analýza toho, že má hmotnost v takovém minimálním intervalu, neuvádí. V případech, kdy je minimální interval standardní posloupnosti právě na hranici výkonnosti přístroje, lze uvést statistickou analýzu pro opakovaná měření.
Běžná praxe není zcela v souladu s mým používáním minimálního intervalu a tím i přiřazením horní a dolní hranice jako vhodné přibližné míry. Ale to, co se dělá, s tím úzce a jednoduše souvisí. Jak se učí v základních kurzech fyziky, pro vyjádření měření jako „s přesností na 0,1 g“ se například měření zapíše jako 1,9 ± 0,1 g. V praxi se obvykle doporučuje používat dva sousední minimální intervaly pro snížení nejistoty a samotné měření vyjádřit jako jediné číslo. Axiomy uvedené v oddíle 3 lze snadno změnit tak, aby se přizpůsobily tomuto použití dvou sousedních namísto jednoho minimálního intervalu.
Tentýž zápis ± se také široce používá k vyjádření statistické standardní chyby opakovaných měření. Z koncepčního hlediska je zde důležité zachovat jak horní, tak dolní míru, neboť základním názorem formalizovaným v axiomech je, že za daných okolností není k dispozici žádné jemnější měření než měření v minimálním intervalu. A žádná teoretická konstrukce rozdělení pravděpodobnosti pro umístění v minimálním intervalu nedává vědecký smysl. Zdůrazňuje se, že uvedená formalizace má být krokem blíže k velké části, ale jistě ne ke všem, skutečné praxe měření, kdy je k dispozici pevná reprezentace ve standardním měřítku.
Jde-li o terminologii, to, co jsem nazval konečnou rovnoměrně rozloženou extenzivní strukturou, by se stejně dobře mohlo nazývat konečnou standardně rozloženou extenzivní strukturou. Terminologie standardních posloupností je známá v literatuře o základech měření. Z tohoto jazyka vyplývá užitečný termín standardní množiny pro množiny vah tvořící standardní posloupnost.
Pro další použití je důležité poznamenat, že pro dvě množiny standardních vah A a B platí, že pokud nejsou váhově ekvivalentní, pak minimální možný rozdíl mezi nimi je váha jedné atomické množiny. Přesněji řečeno, uspořádaná dvojice množin (A, B) je minimální dvojicí standardních množin, jestliže μ(A) – μ(B) = μ(jedné atomární množiny), tj. jejich rozdíl je vlastně minimální pro neekvivalentní standardní množiny. Všimněte si, že pokud je (A, B) minimální dvojice, pak A ≥ B. Ekvivalenci takových dvojic je užitečné definovat. Dvě minimální dvojice (A, B) a (A′, B′,) jsou ekvivalentní, jestliže μ(A) = μ(A′) a μ(B) = μ(B′). Zde jsou tři poznámky, které jsou relevantní pro pozdější diskuse:
Jsou-li (A, B) a (C, D) minimální dvojice, pak μ(A) – μ(B) = μ(C) – μ(D).
(2)
Zřejmě lze relaci uspořádání ≥ rozšířit na minimální dvojice (A, B) a (C,D):
což jsme mohli dříve využít k definování ekvivalentních minimálních dvojic.
(3)
Prázdná množina ϕ je standardní množina.
Předpokládáme-li nyní konečnou rovnoměrně rozloženou rozsáhlou strukturu (označovanou také jako konečná standardní posloupnost), jsou dány další axiomy pro měření přibližně libovolného fyzikálního objektu v rozsahu standardní posloupnosti. Primitivními pojmy jsou nyní
množina Ω objektů,
(ii)
neprázdná rodina F podmnožin Ω,
(iii)
podmnožina S Ω, jejíž prvky tvoří konečnou standardní posloupnost,
(iv)
podmnožina W měřených objektů, tj, W = F|W – {ϕ} je rodina všech neprázdných podmnožin W. (Zápis F|W znamená, že rodina F podmnožin je omezena na podmnožiny W.)
(v)
binární relace ≥ na F, ale nepředpokládá se, že je slabým uspořádáním W. To bude dokázáno později. Stejně jako dříve definujeme: W1 ≥ W2, pokud W1 ≥ a ne W2 ≥ W1. Také: W1 ≈ W2 iff W2 a W2 ≥ W1
Jestliže (S1, S2) je minimální dvojice a S1 ≥ W1 ≥ S2, pak se říká, že (S1 S2) je minimální dvojice pro W1, a také se říká, že W1 má minimální dvojici.
DEFINICE 11: W1 je minimální dvojice pro W1. Struktura Ω = (Ω,F,S,W, ≥) je přibližná extenzivní struktura s konečnou standardní posloupností tehdy a jen tehdy, když W je neprázdná konečná množina, W ⊆ F|W je rodina všech neprázdných podmnožin W a pro všechny S1, S2, S3 a S4 ve F|S a všechny W1 a W2 ve W jsou splněny následující axiomy:
(S, F|S, ≥) je konečná stejně rozsáhlá struktura;
S ∩ W = ϕ a S ∪ W = Ω;
Wi ≥ W2 nebo W2 ≥ Wi;
Jestliže W1 ≥ S2, pak W1 ≥ W2;
Jestliže S1 ≥ W1 ≥ S2, pak S1 ≥ S2;
W1 ≥ S2 nebo S1 ≥ W1;
Jestliže (S1, ϕ) je minimální dvojice, pak W1 ≥ S1;
Jestliže W1 ∩ W2 = ϕ, S1 ≥ W1 ≥ S2, S3 ≥ W2 ≥ S4 a S1 ∩ S3 = ϕ, pak S1 ∪ S3 ≥ W1 ∪ W2 ≥ S2 ∪ S4;
Jestliže W1 ∩ W2 = ϕ, pak existují standardní množiny S1 a S2 takové, že S1 ∩ S2 = ϕ, S1 ≥ W1 a S2 ≥ W2;
Jestliže W1 ≥ W2, pak existuje standardní množina S1 taková, že W1 ≥ S1 ≥ W2;
W1 má minimální dvojici standardních množin.
Některé komentáře k těmto axiomům jsou vhodné. Axiom 1 pouze uvádí strukturu standardních množin do aproximačního rámce. Axiom 2 vyžaduje, aby se objekty v S, kalibrované pro standardní množiny, a objekty ve W, vážené objekty, nepřekrývaly. Axiom 3 je jediný axiom vyjádřený čistě v termínech vážených objektů, bez testů pomocí standardních vah. Jeho požadavek na spojitost ≥ pro W je známý. Axiomy 4-11 pak formulují testovatelné předpoklady, které postačují k ospravedlnění přibližného měření vah spadajících do rozsahu standardních množin. Protože obě množiny S i W jsou konečné, lze každý axiom přímo testovat na rovnoramenných vahách. Axiom 4 poskytuje test na to, že W1 je striktně těžší než W2, totiž najít S1 takové, že W1 ≥ S1 a S1 ≥ W2. Axiom 5 uvádí takříkajíc tranzitivní podmínku na vztah mezi standardními množinami a váženými množinami či objekty. Je-li S1 těžší než W1 a W1 těžší než S2, pak musí platit, že S1 je těžší než S2. Axiom 6 vylučuje, aby jakýkoli vážený objekt W1 měl přesně stejnou hmotnost jako jakákoli standardní množina. Slabší formy tohoto axiomu jsou možné, ale s účastí komplikací testovacích podmínek. Axiom je podobný známým axiomům „nucené volby“ při měření přesvědčení nebo jednání. Axiom 7 vyžaduje, aby libovolný vážený objekt W1 byl těžší než libovolná minimální kladná standardní množina S1. Tento axiom umožňuje, aby váha s rovným ramenem nebo srovnatelné zařízení nebylo citlivé na jakoukoli kladnou hmotnost menší než minimální standardní množina. Axiom 8 je zřejmě zobecněním obvyklého kvalitativního axiomu sčítání uvedeného v axiomu 2 definice 1 na přibližné měření. Axiom 9 zaručuje, že při daných disjunktních množinách W1 a W2, které je třeba zvážit, lze najít disjunktní standardní množiny, které jsou nejmenšími horními hranicemi, S1 pro W1 a S1 pro W2, které jsou rovněž disjunktní. Z ostatních axiomů to nevyplývá, protože pokud W1 ∪ W2 = W, může být sjednocení disjunktních nejmenších horních mezí, S1 ∪ S1, o jednu atomickou standardní množinu větší než nejmenší horní mez samotného W, takže S musí být zvětšeno, aby pokrylo tento případ. Tyto možnosti jsou explicitně uvedeny ve větě 12. Axiom 10 je testem na to, že W1 je striktně těžší než W2, a test je samozřejmě relativní vzhledem k hrubosti standardních množin. Axiom 11 zaručuje, že libovolné vážené objekty nebo množiny objektů spadají do rozsahu standardních množin tím, že mají minimální dvojici standardních množin, tj. diskrétní nejmenší horní hranici a diskrétní největší dolní hranici mezi standardními množinami.
Nejprve uvedeme ukázku elementárních vět se zaměřením na tranzitivitu vztahů ≥ a ≈ mezi množinami vážených objektů.
THEOREM 10. Axiom 11 zaručuje, že libovolné vážené objekty nebo množiny objektů spadají do rozsahu standardních množin tím, že mají minimální dvojici standardních množin, tj. diskrétní nejmenší horní hranici a diskrétní největší dolní hranici mezi standardními množinami. Jestliže W1 ≈ W2 a W2 ≥ W3, pak W1 ≥ W3.
Další věta ukazuje, že relace ekvivalence ≈ pro standardní množiny má vlastnost kongruence pro ≥ na množině S × W.
THEORÉM 11. Je-li S1 ≈ S1 a S1 ≥ W1, pak S1 ≥ W1.
Další věta tvrdí testovatelné kritérium pro nerozlišitelnost W1 a W2.
THEOREM 12. Vědci se domnívají, že W1 a W2 jsou nerozlišitelné. W1 ≈ W2 tehdy a jen tehdy, když W1 a W2 mají ekvivalentní minimální dvojice.
Podobnými metodami můžeme dokázat úzce související výsledek.
THEOREM 13. Nechť (S1, S2) je minimální dvojice pro W1 a (S3, S4) je taková dvojice pro W2. Pak
Nyní jsme schopni tvrdit tranzitivitu nerozlišitelnosti vah.
THEOREM 14. Váhy jsou nerozlišitelné. Jestliže W1 ≈ W2 a W2 ≈ W3, pak W1 ≈ W3.
Důležitost následující věty pro určení aproximace, která platí při sčítání dvou nesouvislých množin W1 a W2 vážených objektů, vyplyne z diskuse, která následuje za větou.
THEOREM 15. Jestliže W1 ∩ W2 = ϕ, pak existují standardní množiny S1, S′1, S2 a S′2 takové, že S1 ∩ S2 = S′1 ∩ S′2 = S′1 ∩ S2 = S′1 ∩ S;′2 = ϕ a
i)
(S1, S′1) je minimální dvojice pro W1,
ii)
(S1, S′2) je minimální dvojice pro W2,
iii)
(S1 ∪ S2, S1 ∪ S′2) a (S1 ∪ S2,S′1 ∪ S2) jsou ekvivalentní minimální dvojice pro W1 ∪ W2, nebo (S1 ∪ S′2, S′1 ∪ S′2) a (S′1 ∪ S2, S′1 ∪ S′2) jsou ekvivalentní minimální dvojice pro W1 ∪ W2.
Při sčítání přibližných vah dvou souborů fyzických objektů z jejich individuálního vážení nelze z přibližného výsledku odvodit, který ze dvou disjunktů formulovaných ve větě 15 platí. Tyto dva disjunkty popisují dva sousední, ale různé minimální intervaly. Je však třeba si všimnout jedné důležité vlastnosti. Sčítání nezvětšuje interval aproximace po sčítání. Když tedy ve větě 15 dostaneme W1 a W2, bez dalších informací nevíme, ve kterém minimálním intervalu W1 ∪ W2 leží, ale jak tvrdí disjunktní závěr axiomu, je to právě jeden ze dvou sousedních minimálních intervalů a empirickým porovnáním můžeme určit, ve kterém.
Disjunktní věta (iii) věty 15 a předpoklad přesnosti, tj, žádné aproximace, v samotném měření standardní posloupnosti, znamenají rozdíl oproti diskusím a výsledkům o aproximaci na několika různých místech v Základech měření . Standardní pojem dvojice (μ*, μ*) horní a dolní míry, užitečné jako míry aproximace, není ve třech svazcích Foundations of Measurement ve skutečnosti nikde zaveden. Definice takové dvojice (μ*, μ*) má podobu, která byla uvedena dříve pro míru μ.
DEFINICE 12. Nechť Ω je neprázdná množina a F neprázdná rodina podmnožin Ω uzavřená pod průnikem a sjednocením a nechť (μ*, μ*) je dvojice funkcí reálné hodnoty definovaná na F. Pak struktura (Ω, F, (μ*, μ*)) je horní dolní mírová struktura tehdy a jen tehdy, jsou-li pro každé A a B ve F splněny následující axiomy:
μ* (ϕ) = μ* (ϕ) =0;
μ* (A) ≥ μ* (A) ≥ 0;
Jestliže A ⊇ B, pak μ* (A) ≥ μ* (B a) μ* (A) ≥ μ* (B);
Jestliže A ∩ B = ϕ, pak μ* (A) + μ* (B) ≤ μ* (A∪B) ≤ μ* (A∪B) ≤ μ* (A) + μ* (B).
Koncept dvojice (μ*, μ*) horní a dolní míry není nový. Sahá přinejmenším k používání vnitřních a vnějších měr v analýze v druhé polovině devatenáctého století Carathedory a dalšími. Použití v pravděpodobnosti se datuje přinejmenším od Koopmana .
Zobrazení přibližného měření je explicitně uvedeno v termínech horních a dolních měr. Ke stanovení subaditivních a superaditivních vlastností horní a dolní míry je zapotřebí věta 15 nebo něco zhruba ekvivalentního. Tyto vlastnosti jsou explicitně formulovány v části (v) následující věty.
VĚTA 16. (Reprezentační věta) Nechť Ω = (Ω,F,S,W, ≥) je přibližná rozsáhlá struktura s konečnou standardní posloupností. Pak existuje míra μ na F|S splňující Větu 1 a dvojice horní a dolní míry (μ*, μ*) na F|S ∪ W taková, že pro libovolné S 1 a S1 ve F|S a W1 a W2 ve W:
(i)
μ* (S1) = μ(S1) = μ* (S1);
(ii)
Jestliže (S1, S′1) je minimální dvojice pro W1, pak μ* (W1) > μ* (W1) = μ(S′)
(iv)
jestliže W1 ⊇ W2, pak μ* (W1) ≥ μ* (W2) a μ* (W2);
(v)
pokud W1 ∩ W2 = ϕ pak μ* (W2) + μ* (W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2).
Srovnání nerovností věty (v) právě dokázané věty se dvěma disjunktními kvalitativními možnostmi vyjádřenými ve větě 15 naznačuje, že lze dokázat těsnější omezení, a to je tento případ. Nerovnosti v klauzuli (v) lze zpřísnit na (v‘) vložením členu μ*(W1) + μ* (W2), který je odůvodněn větou 15.
COROLLARY 1.
(v′) μ*(W1) + μ*(W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2).
Pro větu 16 jsem neuvedl výsledek invariance, neboť ten z této části věty 1 zjevně vyplývá. Existuje však jiná související úvaha, která je zajímavější. Minimální interval konečné standardní posloupnosti S = (S, F, ≥), který je součástí libovolné struktury přibližného extenzivního měření, jak ji charakterizuje Definice 11, fixuje kvalitativní empirickou přesnost empirických měření. Nyní uvažujme druhou konečnou standardní posloupnost T pro měření téže vlastnosti podmnožin W a nechť (T1, T′1) je minimální interval T. Pak na rozdíl od běžného přijetí jednotky extenzivního měření máme v případě přibližného měření přímo kvalitativní srovnání přesnosti dané empirickým poměrem (S1, S′1) k (T1, T′1). Například „váha“, kterou pravidelně používám k vážení sebe sama, má minimální interval 0,25 lb, ale jiná, kterou používám méně často, má minimální interval 0,1 kg. Protože 1 kg = 2,20 lb, poměr 0,25 lb k 0,1 kg je 0,25/,22, což je na dvě desetinná místa 1,14. Protože 1 kg = 2,20 lb, poměr 0,25 lb k 0,1 kg je 0,25/,22. Standardní sekvence kalibrovaná v metrické soustavě je tedy o něco přesnější, i když obě „váhy“ poskytují minimální intervaly přesahující přesnost běžně pozorovanou nebo zaznamenávanou pro většinu účelů. Jakékoli další zpřesnění kterékoli z nich je pro účely měření tělesné hmotnosti málo nebo vůbec nezajímavé.
Podobné příklady lze snadno uvést pro měření délky pomocí různých konečných standardních posloupností. Navíc přibližnou teorii zde rozvinutou v termínech horní a dolní míry lze snadno rozšířit stejnými metodami na rozdílové měření, měření bisekcí a spojnicové měření a s poněkud většími obtížemi i na více dimenzí, např. afinní nebo euklidovskou geometrii. Není překvapivé, že aplikace horních a dolních měr se nejvíce uplatnily při přibližném měření subjektivní pravděpodobnosti. Obsáhlý přehled a analýzu podal Walley . Můj vlastní dřívější příspěvek, Suppes , používá horní a dolní míry pravděpodobnosti, ale s nepřechodnou nerozlišitelností.
Zaměřil jsem se zde na přibližné měření, ale velmi odlišnou teorii horních a dolních měr pravděpodobnosti lze odvodit z přímého množinově-teoretického zobecnění z náhodných veličin jako náhodných funkcí na náhodné relace. Náznakem teoretického rozdílu je, že horní a dolní míry odvozené z náhodných vztahů Suppesem a Zanottim jsou kapacitami nekonečného řádu ve smyslu Choqueta . Naproti tomu zde uvažované horní a dolní míry pro přibližné měření nejsou kapacitami ani druhého řádu. Je zřejmé, že smysl aproximace zavedený zde a u Suppese není v žádném případě jedinou možností
.