3.2 Aproximação qualitativa com medidas superiores e inferiores e indistinguibilidade transitiva
A consideração psicológica dos limiares abaixo, para os quais os julgamentos perceptivos ou outros comparativos são difíceis, se não impossíveis, foi iniciada por Fechner . Uma importante análise matemática precoce foi dada por Wiener . Grande parte da literatura moderna começa com a definição de uma semi-ordem de Luce, que foi axiomatizada como uma relação binária única no caso finito por Scott e Suppes . Algumas das contribuições mais significativas foram de Falmagne .
A análise probabilística dos limiares data, pelo menos, das obras de Thurstone . Falmagne também tem sido um contribuinte central nesta abordagem, com vários outros trabalhos escritos com colegas: Falmagne e Iverson , Falmagne et al. , e Iverson e Falmagne . Uma extensa revisão de toda essa literatura é dada em Suppes et al., .
A maior parte dos trabalhos referidos assume que a indistinguibilidade de eventos, objetos ou estímulos similares é uma relação não transitiva. A suposição implícita é que com muitas observações discriminatórias diferentes, muitos eventos inicialmente indistinguíveis podem ser separados. Aqui o oposto é o ponto de partida e a razão para o uso da palavra “transitivo” no título. É uma consequência dos axiomas introduzidos que a indistinguibilidade é uma relação de equivalência, e portanto, transitória. O resto desta secção baseia-se fortemente em Suppes .
Na secção anterior revi brevemente uma medição extensiva centrada na construção de uma representação padrão finita em escala de raciocínio. A base para a indistinguibilidade transitiva é agora fácil de explicar. Um objeto pesado é atribuído a um intervalo mínimo único, por exemplo, um entre 1,9 g e 2,0 g. A relação binária de dois objetos, a e b, não fazendo parte da seqüência padrão, sendo equivalente em peso, a ≈ b, é que eles sejam atribuídos ao mesmo intervalo mínimo na seqüência padrão. Esta relação é obviamente uma relação de equivalência, ou seja reflexiva, simétrica e transitiva, mas no sistema de aproximação desenvolvido, estas propriedades não são directamente testáveis, mas sim consequências de operações de pesagem com conjuntos de pesos padrão já “calibrados”.
Então, na notação usada mais tarde, um objecto atribuído ao intervalo mínimo (1.9 g, 2,0 g) tem, como aproximação, medida superior (de peso) w* (a) = 2,0 g e medida inferior w*(a) = 1,9 g. Na prática, para todos os procedimentos de medição, exceto os mais refinados, não é dada nenhuma análise estatística de ter peso em tal intervalo mínimo. Nos casos em que o intervalo mínimo da seqüência padrão está apenas no limite do desempenho do instrumento, uma análise estatística pode ser dada para medições repetidas.
A prática comum não está completamente de acordo com o meu uso de um intervalo mínimo e, portanto, a atribuição de um limite superior e um limite inferior como a medida aproximada apropriada. Mas o que é feito está intimamente e simplesmente relacionado. Como ensinado nos cursos de física elementar, para expressar uma medida como “exata até 0,1 g”, por exemplo, a medida é escrita como 1,9 ± 0,1 g. O que geralmente é recomendado na prática é usar dois intervalos mínimos adjacentes para reduzir a incerteza e expressar a medição em si como um único número. Os axiomas apresentados na Secção 3 poderiam ser facilmente alterados para acomodar esta utilização de dois intervalos adjacentes em vez de um intervalo mínimo.
Esta mesma ± notação também é amplamente utilizada para expressar o erro estatístico padrão de medições repetidas. É conceptualmente importante aqui reter tanto as medidas superiores como as inferiores, pois a visão fundamental formalizada nos axiomas é que não existe uma medição mais fina do que a de um intervalo mínimo nas circunstâncias dadas. E nenhuma construção teórica de uma distribuição de probabilidade de localização dentro do intervalo mínimo faz muito sentido do ponto de vista científico. O ponto a ser enfatizado é que a formalização dada pretende ser um passo mais próximo de muita, mas certamente não de toda, prática real de medição quando uma representação em escala padrão fixa está disponível.
Como uma questão de terminologia, o que eu chamei de uma estrutura extensiva finita igualmente espaçada, poderia muito bem ser chamada de uma estrutura extensiva de seqüência padrão finita. A terminologia das seqüências padrão é familiar na literatura sobre os fundamentos da medição. Esta linguagem sugere o termo útil conjuntos de padrões para os conjuntos de pesos que formam uma seqüência padrão.
Para uso posterior é importante notar que para dois conjuntos de pesos padrão A e B, se eles não são equivalentes em peso, então a diferença mínima possível entre eles é o peso de um conjunto atômico. Mais exactamente, o par de conjuntos ordenados (A, B) é um par mínimo de conjuntos padrão se μ(A) – μ(B) = μ(um conjunto atómico), ou seja, a sua diferença é na verdade o mínimo para conjuntos padrão sem equivalente. Note que se (A, B) é um par mínimo, A ≥ B. A equivalência de tais pares é uma noção útil a definir. Dois pares mínimos (A, B) e (A′, B′,) são equivalentes se μ(A) = μ(A′) e μ(B) = μ(B′). Aqui estão três observações que são pertinentes para discussões posteriores.
Se (A, B) e (C, D) são pares mínimos, então μ(A) – μ(B) = μ(C) – μ(D).
(2)
Obviamente a relação de encomenda ≥ pode ser estendida aos pares mínimos (A, B) e (C,D):
que poderíamos ter usado anteriormente para definir pares mínimos equivalentes.
(3)
O conjunto vazio ϕ é um conjunto padrão.
Assumindo agora uma estrutura extensiva finita igualmente espaçada (também referida como uma sequência padrão finita), são dados axiomas adicionais para medir aproximadamente qualquer objecto físico no intervalo da sequência padrão. Os conceitos primitivos são agora
a conjunto Ω de objectos,
(ii)
a família F não vazia de subconjuntos de Ω,
(iii)
a subconjunto S de Ω, cujos elementos formam uma sequência padrão finita,
(iv)
a subconjunto W de objectos a medir, i.e, W = F|W – {ϕ} é a família de todos os subconjuntos não vazios de W. (A notação F|W significa que a família F de subconjuntos é restrita a subconjuntos de W.)
(v)
a relação binária ≥ em F, mas não assumida como uma ordem fraca de W. Isto é provado mais tarde. Como antes, nós definimos: W1 ≥ W2 iff W1 ≥ e não W2 ≥ W1. Também, W1 ≈ W2 iff W2 e W2 ≥ W1
If (S1, S2) é um par mínimo e S1 ≥ W1 ≥ S2, então (S1 S2) é dito que é um par mínimo para W1, e também W1 é dito que tem um par mínimo.
DEFINIÇÃO 11. Uma estrutura Ω = (Ω,F,S,W, ≥) é uma estrutura extensiva aproximada com uma sequência padrão finita se e só se W for um conjunto finito não vazio, W ⊆ F|W é a família de todos os subconjuntos não vazios de W, e os seguintes axiomas são satisfeitos para todos os S1, S2, S3 e S4 em F|S e para todos os W1 e W2 em W:
(S, F|S, ≥) é uma estrutura extensiva finita igualmente espaçada;
S ∩ W = ϕ e S ∪ W = Ω;
Wi ≥ W2 ou W2 ≥ Wi;
Se W1 ≥ S2 depois W1 ≥ W2;
Se S1 ≥ W1 ≥ S2 depois S1 ≥ S2;
W1 ≥ S2 ou S1 ≥ W1;
Se (S1, ϕ) é um par mínimo então W1 ≥ S1;
If W1 ∩ W2 = ϕ, S1 ≥ W1 ≥ S2, S3 ≥ W2 ≥ S4 e S1 ∩ S3 = ϕ, depois S1 ∪ S3 ≥ W1 ∪ W1 ≥ W2 ∪ S2 ∪ S4;
Se W1 ∩ W2 = ϕ, então existem conjuntos padrão S1 e S2 tais que S1 ∩ S2 = ϕ, S1 ≥ W1 e S2 ≥ W2;
Se W1 ≥ W2 então há um conjunto padrão S1 tal que W1 ≥ S1 ≥ W2;
W1 tem um par mínimo de conjuntos padrão.
Alguns comentários sobre estes axiomas são apropriados. O axioma 1 apenas traz a estrutura dos conjuntos padrão dentro da estrutura de aproximação. O Axioma 2 não requer sobreposição de objetos entre aqueles em S, calibrados para conjuntos padrão, e aqueles em W, objetos a serem pesados. O Axioma 3 é o único axioma expresso puramente em termos de objetos pesados, sem testes utilizando pesos padrão. A sua exigência de ligação de ≥ para W é familiar. O axioma 4-11 formula então suposições testáveis que são suficientes para justificar a medição aproximada dos pesos que se enquadram na gama de conjuntos padrão. Como ambos os conjuntos S e W são finitos, cada axioma pode ser testado diretamente em um equilíbrio de braços iguais. O Axioma 4 fornece o teste para W1 sendo estritamente mais pesado que W2, nomeadamente encontrar um S1 tal que W1 ≥ S1 e S1 ≥ W2. O Axioma 5 declara uma condição de transitividade, por assim dizer, na relação entre conjuntos padrão e conjuntos ou objetos pesados. Se S1 é mais pesado que W1 e W1 é mais pesado que S2, então deve ser o caso de que S1 é mais pesado que S2. Axiom 6 exclui que qualquer objeto pesado W1 tenha exatamente o mesmo peso que qualquer conjunto padrão. As formas mais fracas deste axioma são possíveis, mas com as complicações que se apresentam nas condições de teste. O axioma é semelhante aos axiomas familiares de “escolha forçada” na medição de crenças ou acções. O axioma 7 requer que qualquer objecto pesado W1 seja mais pesado do que qualquer conjunto padrão positivo mínimo S1. Este axioma permite que um equilíbrio igual de braço ou dispositivo comparável não seja sensível a qualquer peso positivo menor do que um conjunto padrão mínimo. O Axioma 8 é obviamente a generalização para a medição aproximada do axioma qualitativo de adição habitual exemplificado no Axioma 2 da Definição 1. O Axioma 9 garante que, dados os conjuntos desjoint W1 e W2 a serem pesados, podem ser encontrados conjuntos padrão desjoint que são menos limites superiores, S1 para W1 e S1 para W2, que também são desjoint. Isto não decorre de outros axiomas, porque se W1 ∪ W2 = W, a união dos limites inferiores do desjuntor, S1 ∪ S1 pode ser um conjunto padrão atômico maior que um limite inferior do próprio W, então S deve ser aumentado para cobrir este caso. As possibilidades são explicitadas no Teorema 12. Axioma 10 é um teste para que W1 seja estritamente mais pesado que W2, e o teste é, naturalmente, relativo à rugosidade dos conjuntos padrão. O Axioma 11 garante que quaisquer objetos, ou conjunto de objetos, a serem pesados se enquadram no intervalo dos conjuntos padrão por ter um par mínimo de conjuntos padrão, ou seja, um limite mínimo superior discreto e um limite máximo inferior discreto entre os conjuntos padrão.
Uma amostra de teoremas elementares é apresentada em primeiro lugar, com foco na transitividade das relações ≥ e ≈ entre conjuntos de objetos a serem pesados.
THEOREM 10. Se W1 ≈ W2 e W2 ≥ W3 então W1 ≥ W3.
O teorema seguinte mostra que a relação de equivalência ≈ para conjuntos padrão tem a propriedade de congruência para ≥ no conjunto S × W.
THEOREM 11. Se S1 ≈ S1 e S1 ≥ W1 então S1 ≥ W1.
O próximo teorema afirma que o critério de teste para W1 e W2 é indistinguível.
THEOREM 12. W1 ≈ W2 se e somente se W1 e W2 tiverem pares mínimos equivalentes.
Por métodos similares, podemos provar um resultado intimamente relacionado.
THEOREM 13. Que (S1, S2) seja um par mínimo para W1, e (S3, S4) seja um par equivalente para W2. Então
Estamos agora em posição de afirmar a transitividade da indistinguibilidade dos pesos.
THEOREM 14. Se W1 ≈ W2 e W2 ≈ W3 então W1 ≈ W3.
A importância do próximo teorema para determinar a aproximação que se mantém sob a adição de dois conjuntos disjuntos W1 e W2 de objetos a serem pesados é trazida à tona na discussão após o teorema.
THEOREM 15. Se W1 ∩ W2 = ϕ, então existem os conjuntos padrão S1, S′1, S2 e S′2 de forma que S1 ∩ S2 = S′1 ∩ S′2 = S′1 ∩ S2 = S′1 ∩ S2 = S′1 ∩ S;′2 = ϕ, e
(i)
(S1, S′1) é um par mínimo para W1,
(ii)
(S1, S′2) é um par mínimo para W2,
(iii)
(S1 ∪ S2, S1 ∪ S′2) e (S1 ∪ S2,S′1 ∪ S2) são pares mínimos equivalentes para W1 ∪ W2, ou (S1 ∪ S′2, S′1 ∪ S′2) e (S′1 ∪ S2, S′1 ∪ S′2) são pares mínimos equivalentes para W1 ∪ W2.
Ao adicionar o peso aproximado de duas coleções de objetos físicos, a partir da pesagem dos mesmos individualmente, o resultado aproximado não nos permite inferir qual dos dois disjuntos formulados em Theorem 15 é válido. Estas duas disjuntas descrevem dois intervalos mínimos adjacentes, mas diferentes. Mas há uma característica importante a ser observada. A adição não aumenta o intervalo de aproximação após a adição. Assim, no Teorema 15, quando nos é dado W1 e W2, sem mais informações não sabemos em qual intervalo mínimo W1 ∪ W2, mas, como a conclusão disjuntiva do axioma afirma, é apenas um de dois intervalos mínimos adjacentes, e fazendo a comparação empiricamente, podemos determinar qual.
A cláusula disjuntiva (iii) do Teorema 15 e a suposição de exatidão, ou seja nenhuma aproximação, na própria medição da seqüência padrão, marca uma diferença em relação às discussões e resultados sobre aproximação em vários lugares diferentes em Fundamentos de Medição . Na verdade, o conceito padrão de um par (μ*, μ*) de medidas superiores e inferiores, útil como medidas de aproximação, não é introduzido em nenhum dos três volumes de Fundamentos de Medida. A definição de tal par (μ*, μ*) segue a forma dada anteriormente para uma medida μ.
DEFINIÇÃO 12. Que Ω seja um conjunto não vazio e F uma família não vazia de subconjuntos de Ω fechados sob intersecção e união, e que (μ*, μ*) seja um par de funções com valor real definido em F. Então a estrutura (Ω, F, (μ*, μ*)) é uma estrutura de medida superior-baixa se e somente se os seguintes axiomas forem satisfeitos para cada A e B em F:
μ* (ϕ) = μ* (ϕ) =0;
μ* (A) ≥ μ* (A) ≥ 0;
Se A ⊇ B então μ* (A) ≥ μ* (B e) μ* (A) ≥ μ* (A) ≥ μ* (B);
Se A ∩ B = ϕ, então μ* (A) + μ* (B) ≤ μ* (A∪B) ≤ μ* (A∪B) ≤ μ* (A) + μ* (B).
O conceito de um par (μ*, μ*) de medidas superiores e inferiores não é novo. Ele remonta pelo menos ao uso de medidas internas e externas em análise na última parte do século XIX por Carathedory e outros. O uso em probabilidade remonta pelo menos a Koopman .
A representação da medida aproximada é dada explicitamente em termos de medidas superiores e inferiores. O teorema 15, ou algo mais ou menos equivalente, é necessário para estabelecer as propriedades subaditivas e superaditivas das medidas superior e inferior. Estas propriedades são formuladas explicitamente em parte (v) do próximo teorema.
THEOREM 16. (Teorema da Representação) Que Ω = (Ω,F,S,W, ≥) seja uma estrutura extensiva aproximada com uma sequência padrão finita. Depois há uma medida μ em F|S satisfazendo o Teorema 1, e um par de medidas superior e inferior (μ*, μ*) em F|S ∪ W tal que para qualquer S 1 e S1 em F|S e W1 e W2 em W:
(i)
μ* (S1) = μ(S1) = μ* (S1);
(ii)
Se (S1, S′1) é um par mínimo para W1, então μ* (W1) > μ* (W1) = μ(S′)
(iv)
se W1 ⊇ W2, então μ* (W1) ≥ μ* (W2) e μ* (W2);
(v)
se W1 ∩ W2 = ϕ então μ* (W2) + μ* (W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2).
Comparação das desigualdades da cláusula (v) do teorema que acaba de ser provado com as duas possibilidades qualitativas disjuntivas expressas no teorema 15 sugerem que um limite mais apertado pode ser provado, e este é o caso. As desigualdades na cláusula (v) podem ser restringidas a (v’) pela inserção do termo μ*(W1) + μ* (W2) que é justificado pelo teorema 15.
COROLLARY 1.
(v′) μ*(W1) + μ*(W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2).
Não declarei um resultado de invariância para Theorem 16, pois o óbvio decorre desta parte de Theorem 1. Mas há uma consideração relacionada diferente de maior interesse. O intervalo mínimo da seqüência padrão finita S = (S, F, ≥) que faz parte de qualquer estrutura de medida aproximada extensiva, como caracterizada pela Definição 11, fixa a precisão empírica qualitativa das medidas empíricas. Agora considere uma segunda seqüência padrão finita T para medir a mesma propriedade dos subconjuntos de W, e deixe (T1, T′1) ser o intervalo mínimo de T. Então, ao contrário da aceitação convencional de uma unidade de medida extensiva, no caso de medida aproximada, temos uma comparação qualitativa direta da precisão dada pela relação empírica de (S1, S′1) para (T1, T′1). Por exemplo, a “balança” que uso regularmente para me pesar tem um intervalo mínimo de 0,25 lb, mas outra que uso com menos frequência tem um intervalo mínimo de 0,1 kg. Desde 1 kg = 2,20 lb, a razão de 0,25 lb para 0,1 kg é .25/.22, que é, com duas casas decimais, 1,14. Assim, a seqüência padrão calibrada no sistema métrico é ligeiramente mais precisa, embora ambas as “escalas” forneçam intervalos mínimos além da precisão normalmente observada ou registrada para a maioria das finalidades. Qualquer refinamento adicional de qualquer uma delas tem pouco ou nenhum interesse para o propósito de medir o peso corporal.
Exemplos simples são facilmente dados para a medição do comprimento usando diferentes seqüências padrão finitas. Além disso, a teoria aproximada aqui desenvolvida em termos de medidas superiores e inferiores pode facilmente ser estendida pelos mesmos métodos para medição de diferença, medição de bissecção e medição conjunta, e com um pouco mais de dificuldade para várias dimensões, por exemplo, a geometria afim ou euclidiana. Não é surpreendente que as aplicações de medidas superiores e inferiores tenham sido mais aplicadas à medição aproximada da probabilidade subjetiva. Uma revisão e análise abrangente é dada por Walley . Minha própria contribuição anterior, Suppes , utiliza probabilidades superiores e inferiores, mas com indistinguibilidade não-transitiva.
O foco aqui tem sido a medição aproximada, mas uma teoria muito diferente de probabilidades superiores e inferiores pode ser derivada de uma generalização teórica direta de variáveis aleatórias como funções aleatórias para relações aleatórias. Uma indicação da diferença teórica é que as medidas superior e inferior derivadas de relações aleatórias por Suppes e Zanotti são capacidades de ordem infinita no sentido de Choquet . Em contraste, as medidas superior e inferior aqui consideradas para medida aproximada não são sequer capacidades de ordem dois. Claramente, o sentido de aproximação introduzido aqui e em Suppes não é em nenhum sentido a única possibilidade.