3.2 Approximation qualitative avec mesures supérieures et inférieures et indiscernabilité transitive
La considération psychologique des seuils inférieurs, pour lesquels les jugements perceptifs ou autres jugements comparatifs sont difficiles, voire impossibles, a été initiée par Fechner . Une première analyse mathématique importante a été donnée par Wiener . Une grande partie de la littérature moderne commence avec la définition de Luce d’un semi-ordre, qui a été axiomatisé comme une relation binaire unique dans le cas fini par Scott et Suppes . Certaines des contributions les plus significatives ont été apportées par Falmagne .
L’analyse probabiliste des seuils date au moins des travaux de Thurstone . Falmagne a également été un contributeur central à cette approche, avec un certain nombre d’autres articles écrits avec des collègues : Falmagne et Iverson , Falmagne et al, , et Iverson et Falmagne . Un examen approfondi de toute cette littérature est donné dans Suppes et al., .
La quasi-totalité du travail mentionné suppose que l’indiscernabilité d’événements, d’objets ou de stimuli similaires est une relation non transitive. L’hypothèse implicite est qu’avec de nombreuses observations discriminantes différentes, de nombreux événements initialement indiscernables peuvent être séparés. Le contraire est ici le point de départ et la raison de l’utilisation du mot « transitif » dans le titre. C’est une conséquence des axiomes introduits que l’indiscernabilité est une relation d’équivalence, et donc, transitive. Le reste de cette section s’inspire fortement de Suppes .
Dans la section précédente, j’ai brièvement passé en revue une mesure extensive axée sur la construction d’une représentation d’échelle de rapport standard finie. La base de l’indiscernabilité transitive est maintenant facile à expliquer. Un objet pesé est affecté à un intervalle minimal unique, par exemple, un intervalle compris entre 1,9 g et 2,0 g. La relation binaire de deux objets, a et b, ne faisant pas partie de la séquence standard, étant équivalents en poids, a ≈ b, est qu’ils soient affectés au même intervalle minimal dans la séquence standard. Cette relation est évidemment une relation d’équivalence, c’est-à-dire , réflexive, symétrique et transitive, mais dans le système d’approximation développé, ces propriétés ne sont pas directement testables, mais plutôt des conséquences des opérations de pesée avec des ensembles de poids standards déjà « calibrés ».
Donc, dans la notation utilisée par la suite, un objet affecté à l’intervalle minimal (1.9 g, 2,0 g) est dit avoir, par approximation, une mesure supérieure (de poids) w* (a) = 2,0 g et une mesure inférieure w*(a) = 1,9 g. En pratique, pour toutes les procédures de mesure, sauf les plus raffinées, aucune analyse statistique du fait d’avoir un poids dans un tel intervalle minimal n’est donnée. Dans les cas où l’intervalle minimal de la séquence standard est juste à la limite de la performance de l’instrument, une analyse statistique peut être donnée pour des mesures répétées.
La pratique ordinaire n’est pas complètement en accord avec mon utilisation d’un intervalle minimal et donc l’attribution d’une limite supérieure et inférieure comme mesure approximative appropriée. Mais ce qui est fait est étroitement et simplement lié. Comme cela est enseigné dans les cours de physique élémentaires, pour exprimer une mesure comme « précise à 0,1 g », par exemple, la mesure est écrite comme 1,9 ± 0,1 g. Dans la pratique, il est généralement recommandé d’utiliser deux intervalles minimaux adjacents pour réduire l’incertitude et d’exprimer la mesure elle-même sous la forme d’un seul nombre. Les axiomes donnés dans la section 3 pourraient facilement être modifiés pour s’adapter à cette utilisation de deux intervalles minimaux adjacents plutôt qu’un seul.
Cette même notation ± est aussi largement utilisée pour exprimer l’erreur standard statistique de mesures répétées. Il est conceptuellement important ici de conserver les mesures supérieures et inférieures, car le point de vue fondamental formalisé dans les axiomes est qu’aucune mesure plus fine que celle d’un intervalle minimal n’est disponible dans les circonstances données. Et aucune construction théorique d’une distribution de probabilité pour la localisation à l’intérieur de l’intervalle minimal n’a beaucoup de sens scientifique. Le point souligné est que la formalisation donnée est censée se rapprocher d’une grande partie, mais certainement pas de la totalité, de la pratique réelle de la mesure lorsqu’une représentation fixe à l’échelle standard est disponible.
Pour une question de terminologie, ce que j’ai appelé une structure extensive finie à espacement égal, pourrait tout aussi bien être appelé une structure extensive à séquence standard finie. La terminologie des séquences standard est familière dans la littérature sur les fondements de la mesure. Ce langage suggère le terme utile d’ensembles standards pour les ensembles de poids formant une séquence standard.
Pour une utilisation ultérieure, il est important de noter que pour deux ensembles de poids standards A et B, s’ils ne sont pas équivalents en poids, alors la différence minimale possible entre eux est le poids d’un ensemble atomique. Plus exactement, la paire ordonnée d’ensembles (A, B) est une paire minimale d’ensembles standards si μ(A) – μ(B) = μ(un ensemble atomique), c’est-à-dire que leur différence est en fait le minimum pour des ensembles standards non équivalents. Notez que si (A, B) est une paire minimale, A ≥ B. L’équivalence de telles paires est une notion utile à définir. Deux paires minimales (A, B) et (A′, B′,) sont équivalentes si μ(A) = μ(A′) et μ(B) = μ(B′). Voici trois observations qui sont pertinentes pour les discussions ultérieures.
Si (A, B) et (C, D) sont des paires minimales, alors μ(A) – μ(B) = μ(C) – μ(D).
(2)
Evidemment la relation d’ordre ≥ peut être étendue aux paires minimales (A, B) et (C,D):
que nous aurions pu utiliser plus tôt pour définir des paires minimales équivalentes.
(3)
L’ensemble vide ϕ est un ensemble standard.
En supposant maintenant une structure extensive finie équidistante (aussi appelée séquence standard finie), des axiomes supplémentaires sont donnés pour mesurer approximativement tout objet physique dans le domaine de la séquence standard. Les concepts primitifs sont maintenant
un ensemble Ω d’objets,
(ii)
une famille non vide F de sous-ensembles de Ω,
(iii)
un sous-ensemble S de Ω, dont les éléments forment une séquence standard finie,
(iv)
un sous-ensemble W d’objets à mesurer, c’est-à-dire , W = F|W – {ϕ} est la famille de tous les sous-ensembles non vides de W. (La notation F|W signifie que la famille F de sous-ensembles est restreinte aux sous-ensembles de W.)
(v)
une relation binaire ≥ sur F, mais non supposée être un ordre faible de W, ce qui sera prouvé plus tard. Comme précédemment, on définit : W1 ≥ W2 si W1 ≥ et non W2 ≥ W1. De même, W1 ≈ W2 iff W2 et W2 ≥ W1
Si (S1, S2) est une paire minimale et S1 ≥ W1 ≥ S2, alors (S1 S2) est dit être une paire minimale pour W1, et aussi W1 est dit avoir une paire minimale.
DEFINITION 11. Une structure Ω = (Ω,F,S,W, ≥) est une structure extensive approximative avec une séquence standard finie si et seulement si W est un ensemble fini non vide, W ⊆ F|W est la famille de tous les sous-ensembles non vides de W, et les axiomes suivants sont satisfaits pour tous les S1, S2, S3 et S4 dans F|S et tous les W1 et W2 dans W :
(S, F|S, ≥) est une structure extensive finie équidistante;
S ∩ W = ϕ et S ∪ W = Ω;
Wi ≥ W2 ou W2 ≥ Wi ;
Si W1 ≥ S2 alors W1 ≥ W2;
Si S1 ≥ W1 ≥ S2 alors S1 ≥ S2;
W1 ≥ S2 ou S1 ≥ W1;
Si (S1, ϕ) est une paire minimale alors W1 ≥ S1 ;
Si W1 ∩ W2 = ϕ, S1 ≥ W1 ≥ S2, S3 ≥ W2 ≥ S4 et S1 ∩ S3 = ϕ, alors S1 ∪ S3 ≥ W1 ∪ W2 ≥ S2 ∪ S4 ;
Si W1 ∩ W2 = ϕ alors il existe des ensembles standards S1 et S2 tels que S1 ∩ S2 = ϕ, S1 ≥ W1 et S2 ≥ W2 ;
Si W1 ≥ W2 alors il existe un ensemble standard S1 tel que W1 ≥ S1 ≥ W2;
W1 possède une paire minimale d’ensembles standard.
Il convient de faire quelques commentaires sur ces axiomes. L’axiome 1 fait juste entrer la structure des ensembles standards dans le cadre de l’approximation. L’axiome 2 exige qu’il n’y ait pas de chevauchement d’objets entre ceux de S, étalonnés pour les ensembles standards, et ceux de W, objets à peser. L’axiome 3 est le seul axiome exprimé purement en termes d’objets pesés, sans tests utilisant les poids standards. Son exigence de connexité de ≥ pour W est familière. Les axiomes 4 à 11 formulent ensuite des hypothèses testables qui sont suffisantes pour justifier la mesure approximative de poids tombant dans la gamme des ensembles standard. Comme les ensembles S et W sont tous deux finis, chaque axiome peut être testé directement sur une balance à bras égaux. L’axiome 4 fournit le test pour que W1 soit strictement plus lourd que W2, à savoir trouver un S1 tel que W1 ≥ S1 et S1 ≥ W2. L’axiome 5 énonce une condition de transitivité, pour ainsi dire, sur la relation entre les ensembles standards et les ensembles ou objets pesés. Si S1 est plus lourd que W1 et que W1 est plus lourd que S2, alors il doit être le cas que S1 est plus lourd que S2. L’axiome 6 exclut que tout objet pesé W1 ait exactement le même poids que tout ensemble standard. Des formes plus faibles de cet axiome sont possibles, mais avec les complications des conditions d’essai. Cet axiome est similaire aux axiomes familiers de « choix forcé » dans la mesure des croyances ou des actions. L’axiome 7 exige que tout objet pesé W1 soit plus lourd que tout ensemble standard positif minimal S1. Cet axiome permet à une balance à bras égaux ou à un dispositif comparable de ne pas être sensible à tout poids positif inférieur à un ensemble standard minimal. L’axiome 8 est évidemment la généralisation aux mesures approximatives de l’axiome qualitatif habituel de l’addition illustré par l’axiome 2 de la définition 1. L’axiome 9 garantit que, étant donné des ensembles disjoints W1 et W2 à pondérer, on peut trouver des ensembles standard disjoints qui sont des bornes supérieures minimales, S1 pour W1 et S1 pour W2, et qui sont également disjoints. Cela ne découle pas des autres axiomes, car si W1 ∪ W2 = W, l’union des limites inférieures disjointes, S1 ∪ S1 peut être un ensemble standard atomique plus grand qu’une limite inférieure de W lui-même, donc S doit être agrandi pour couvrir ce cas. Les possibilités sont explicitées dans le Théorème 12. L’axiome 10 est un test pour que W1 soit strictement plus lourd que W2, et le test est, bien sûr, relatif à la grossièreté des ensembles standards. L’axiome 11 garantit que tout objet, ou ensemble d’objets, à peser tombe dans le domaine des ensembles standards en ayant une paire minimale d’ensembles standards, c’est-à-dire une borne supérieure minimale discrète et une borne inférieure maximale discrète parmi les ensembles standards.
On énonce d’abord un échantillon de théorèmes élémentaires, en se concentrant sur la transitivité des relations ≥ et ≈ entre les ensembles d’objets à peser.
Théorème 10. Si W1 ≈ W2 et W2 ≥ W3 alors W1 ≥ W3.
Le théorème suivant montre que la relation d’équivalence ≈ pour les ensembles standards a la propriété de congruence pour ≥ sur l’ensemble S × W.
Théorème 11. Si S1 ≈ S1 et S1 ≥ W1 alors S1 ≥ W1.
Le théorème suivant affirme le critère testable pour que W1 et W2 soient indiscernables.
Théorème 12. W1 ≈ W2 si et seulement si W1 et W2 ont des paires minimales équivalentes.
Par des méthodes similaires, nous pouvons prouver un résultat étroitement lié.
Théorème 13. Soit (S1, S2) une paire minimale pour W1, et (S3, S4) une telle paire pour W2. Alors
Nous sommes maintenant en mesure d’affirmer la transitivité de l’indiscernabilité des poids.
Théorème 14. Si W1 ≈ W2 et W2 ≈ W3 alors W1 ≈ W3.
L’importance du théorème suivant pour déterminer l’approximation qui tient sous l’addition de deux ensembles disjoints W1 et W2 d’objets à peser est mise en évidence dans la discussion qui suit le théorème.
Théorème 15. Si W1 ∩ W2 = ϕ, alors il existe des ensembles normalisés S1, S′1, S2 et S′2 tels que S1 ∩ S2 = S′1 ∩ S′2 = S′1 ∩ S2 = S′1 ∩ S ;′2 = ϕ, et
(i)
(S1, S′1) est une paire minimale pour W1,
(ii)
(S1, S′2) est une paire minimale pour W2,
(iii)
(S1 ∪ S2, S1 ∪ S′2) et (S1 ∪ S2,S′1 ∪ S2) sont des paires minimales équivalentes pour W1 ∪ W2, ou (S1 ∪ S′2, S′1 ∪ S′2) et (S′1 ∪ S2, S′1 ∪ S′2) sont des paires minimales équivalentes pour W1 ∪ W2.
En additionnant le poids approximatif de deux collections d’objets physiques, à partir de leur pesée individuelle, le résultat approximatif ne permet pas de déduire laquelle des deux disjonctions formulées dans le théorème 15 tient. Ces deux disjonctions décrivent deux intervalles minimaux adjacents mais différents. Mais il y a une caractéristique importante à noter. L’addition n’augmente pas l’intervalle d’approximation après l’addition. Ainsi, dans le théorème 15, lorsqu’on nous donne W1 et W2, sans autre information, nous ne savons pas dans quel intervalle minimal se trouve W1 ∪ W2, mais, comme l’affirme la conclusion disjonctive de l’axiome, il s’agit juste d’un des deux intervalles minimaux adjacents, et en faisant la comparaison empiriquement, nous pouvons déterminer lequel.
La clause disjonctive (iii) du théorème 15 et l’hypothèse d’exactitude, c’est-à-dire, aucune approximation, dans la mesure de la séquence standard elle-même, marquent une différence par rapport aux discussions et aux résultats sur l’approximation à plusieurs endroits différents dans Foundations of Measurement . En fait, le concept standard d’une paire (μ*, μ*) de mesures supérieure et inférieure, utile comme mesure d’approximation, n’est introduit nulle part dans les trois volumes de Foundations of Measurement. La définition d’une telle paire (μ*, μ*) suit dans la forme celle donnée précédemment pour une mesure μ.
DEFINITION 12. Soit Ω un ensemble non vide et F une famille non vide de sous-ensembles de Ω fermée sous intersection et union, et soit (μ*, μ*) une paire de fonctions à valeurs réelles définies sur F. Alors la structure (Ω, F, (μ*, μ*)) est une structure de mesure supérieure inférieure si et seulement si les axiomes suivants sont satisfaits pour tout A et B dans F :
μ* (ϕ) = μ* (ϕ) =0;
μ* (A) ≥ μ* (A) ≥ 0;
Si A ⊇ B alors μ* (A) ≥ μ* (B et) μ* (A) ≥ μ* (B) ;
Si A ∩ B = ϕ, alors μ* (A) + μ* (B) ≤ μ* (A∪B) ≤ μ* (A∪B) ≤ μ* (A) + μ* (B).
Le concept d’une paire (μ*, μ*) de mesures supérieure et inférieure n’est pas nouveau. Il remonte au moins à l’utilisation des mesures intérieures et extérieures en analyse dans la dernière partie du dix-neuvième siècle par Carathedory et d’autres. L’utilisation en probabilité remonte au moins à Koopman .
La représentation de la mesure approximative est explicitement donnée en termes de mesures supérieures et inférieures. Le théorème 15, ou quelque chose d’à peu près équivalent, est nécessaire pour établir les propriétés subadditives et superadditives des mesures supérieures et inférieures. Ces propriétés sont formulées explicitement dans la partie (v) du théorème suivant.
Théorème 16. (Théorème de représentation) Soit Ω = (Ω,F,S,W, ≥) une structure extensive approchée avec une séquence standard finie. Alors il existe une mesure μ sur F|S satisfaisant le théorème 1, et une paire de mesures supérieure et inférieure (μ*, μ*) sur F|S ∪ W telle que pour tout S 1 et S1 dans F|S et W1 et W2 dans W :
(i)
μ* (S1) = μ(S1) = μ* (S1) ;
(ii)
Si (S1, S′1) est une paire minimale pour W1, alors μ* (W1) > μ* (W1) = μ(S′)
(iv)
si W1 ⊇ W2, alors μ* (W1) ≥ μ* (W2) et μ* (W2) ;
(v)
si W1 ∩ W2 = ϕ alors μ* (W2) + μ* (W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2).
La comparaison des inégalités de la clause (v) du théorème qui vient d’être prouvé avec les deux possibilités qualitatives disjonctives exprimées dans le théorème 15 suggère qu’une borne plus serrée peut être prouvée, et c’est le cas. Les inégalités de la clause (v) peuvent être resserrées en (v’) par l’insertion du terme μ*(W1) + μ* (W2) qui est justifié par le théorème 15.
COROLLARY 1.
(v′) μ*(W1) + μ*(W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2) ≤ μ* (W1 ∪ W2) ≤ μ* (W1) + μ* (W2).
Je n’ai pas énoncé de résultat d’invariance pour le théorème 16, car celui qui est évident découle de cette partie du théorème 1. Mais il existe une autre considération connexe de plus grand intérêt. L’intervalle minimal de la séquence standard finie S = (S, F, ≥) qui fait partie de toute structure de mesure extensive approximative, telle que caractérisée par la définition 11, fixe la précision empirique qualitative des mesures empiriques. Considérons maintenant une seconde séquence standard finie T pour mesurer la même propriété des sous-ensembles de W, et soit (T1, T′1) l’intervalle minimal de T. Alors, contrairement à l’acceptation conventionnelle d’une unité de mesure extensive, dans le cas de la mesure approximative, nous avons une comparaison directement qualitative de la précision donnée par le rapport empirique de (S1, S′1) à (T1, T′1). Par exemple, la » balance » que j’utilise régulièrement pour me peser a un intervalle minimal de 0,25 lb, mais une autre que j’utilise moins souvent a un intervalle minimal de 0,1 kg. Comme 1 kg = 2,20 lb, le rapport entre 0,25 lb et 0,1 kg est de 0,25/,22, soit, à deux décimales près, 1,14. La séquence standard étalonnée dans le système métrique est donc légèrement plus précise, bien que les deux « échelles » fournissent des intervalles minimums au-delà de la précision habituellement observée ou enregistrée pour la plupart des usages. Tout raffinement supplémentaire de l’une ou l’autre n’a que peu ou pas d’intérêt pour la mesure du poids corporel.
Des exemples similaires sont facilement donnés pour la mesure de la longueur en utilisant différentes séquences standard finies. De plus, la théorie approximative développée ici en termes de mesures supérieures et inférieures peut facilement être étendue par les mêmes méthodes à la mesure de différence, à la mesure de bissection et à la mesure conjointe, et avec un peu plus de difficulté à plusieurs dimensions, par exemple à la géométrie affine ou euclidienne. Il n’est pas surprenant que les applications des mesures supérieures et inférieures aient été les plus utilisées pour la mesure approximative de la probabilité subjective. Une revue et une analyse complètes sont présentées par Walley . Ma propre contribution antérieure, Suppes , utilise des probabilités supérieures et inférieures, mais avec une indiscernabilité non transitive.
L’accent a été mis ici sur la mesure approximative, mais une théorie très différente des probabilités supérieures et inférieures peut être dérivée d’une généralisation directe de la théorie des ensembles, des variables aléatoires comme fonctions aléatoires aux relations aléatoires. Une indication de la différence théorique est que les mesures supérieures et inférieures dérivées des relations aléatoires par Suppes et Zanotti sont des capacités d’ordre infini au sens de Choquet . En revanche, les mesures supérieures et inférieures considérées ici pour la mesure approximative ne sont même pas des capacités d’ordre deux. Il est clair que le sens de l’approximation introduit ici et dans Suppes n’est en aucun cas la seule possibilité.