Théories de la catégorisation
Une façon de considérer les systèmes de connaissances est comme des mécanismes formels de classification et de catégorisation des objets. Graphiquement, une ontologie typique ressemble à une taxonomie hiérarchique – bien que, techniquement, il s’agisse d’un graphe acyclique dirigé, ce qui signifie que les concepts peuvent avoir plus d’un seul » parent » ainsi que de multiples » frères et sœurs » et » enfants « . (Les ontologies peuvent également supporter d’autres types de relations conceptuelles, mais la relation de subsomption est axiomatisée dans la sémantique de l’OWL directement, comme le sont plusieurs autres relations). Dans de tels systèmes, l’application des concepts repose sur le fait que les objets répondent aux conditions nécessaires et suffisantes d’appartenance à une classe. Ce modèle général s’accorde bien avec la vaste tradition d’application de catégories qui remonte à Aristote. Cependant, les ontologies sont censées être des représentations de conceptualisations orientées vers la machine, avec seulement une relation analogique avec les modèles cognitifs mentaux. Que peut-on donc glaner des théories contemporaines de la catégorisation ?
Depuis les années 1960, des modèles alternatifs ont été proposés sur la façon dont les concepts mentaux sont organisés et appliqués. Comme les ontologies, les réseaux sémantiques, dont Quillian (1967) a été le pionnier, modélisent les réseaux conceptuels cognitifs comme des graphes dirigés, avec des concepts connectés par des liens associatifs unidirectionnels. Contrairement aux ontologies, ces liens n’impliquent aucun type de relation logique (ou autre) entre les concepts, mais seulement l’existence d’une association générale. Les réseaux sémantiques ont été adaptés aux premiers systèmes de représentation des connaissances, tels que les systèmes de cadres, qui utilisent la même structure graphique de nœuds et de liens conceptuels : Nous pouvons considérer un cadre comme un réseau de nœuds et de relations » (Minsky 1974). Minsky note aussi explicitement la similarité entre les systèmes de cadres et les paradigmes kuhniens – ce qui résulte de la construction d’un système de cadres comme un point de vue sur une tranche du monde. Par extension, les réseaux sémantiques peuvent être considérés comme des proto-paradigmes au sens kuhnien, bien qu’il ne soit pas clair quelles pourraient être les limites entre un réseau et un autre – cette analogie ne doit donc pas être trop poussée.
Une caractéristique des réseaux sémantiques est l’absence de formalisme logique sous-jacent. Alors que les systèmes de cadre de Minsk et d’autres analogues dans les années 1970 ont été « mis à jour » avec des couches sémantiques formelles, notamment par le développement des logiques de description dans les années 1980, selon Minsky, le manque d’appareil formel est une « caractéristique » plutôt qu’un « bug » – l’imposition de contrôles de cohérence, par exemple, impose une contrainte irréaliste sur les tentatives de représenter les types de connaissances humaines, précisément parce que les humains sont rarement cohérents dans leur utilisation des concepts (Minsky 1974). Au mieux, on leur demande d’être cohérents dans une partie localisée de leur réseau sémantique cognitif, en rapport avec un problème donné, et les concepts et raisonnements associés nécessaires pour le traiter. De même, les auteurs des modèles de réseaux sémantiques notent la difficulté de supposer que des graphiques bien structurés modèlent l’organisation conceptuelle mentale : « Les définitions des dictionnaires ne sont pas très ordonnées et nous doutons que la mémoire humaine, qui est beaucoup plus riche, soit même aussi ordonnée qu’un dictionnaire » (Collins et Quillian 1969). Les réseaux sémantiques représentent un modèle précoce et durable de la cognition, qui continue d’exercer une influence sur des modèles actualisés tels que les réseaux neuronaux et le traitement distribué parallèle (Rogers et McClelland 2004). Ces réseaux présentent également deux caractéristiques pertinentes pour la théorie adoptée ici : premièrement, l’accent mis sur les modèles structurels et connexionnistes de la cognition – selon lesquels les concepts ne sont pas simplement accumulés quantitativement comme des entrées dans un dictionnaire cognitif, mais sont également interconnectés, de sorte que l’ajout de nouveaux concepts fait une différence qualitative dans la façon dont les concepts existants sont appliqués ; et deuxièmement, la cohérence implicite des réseaux, qui suggère que les concepts ne sont pas simplement disposés au hasard, mais forment des schémas ou des structures cohérents et explicatifs.
Au milieu des années 1970, la théorie du prototype, un autre modèle cognitif, a été proposée pour décrire l’utilisation des concepts. S’appuyant sur le développement des « jeux de langage » de Wittgenstein (Wittgenstein 1967), Rosch (1975) a démontré par une série d’expériences empiriques que le processus de classification des objets sous des étiquettes conceptuelles n’était généralement pas entrepris en recherchant des conditions nécessaires et suffisantes pour l’existence de concepts. Les concepts sont plutôt appliqués en fonction des similitudes entre un objet perçu et un « prototype » conceptuel – une instance typique ou exemplaire d’un concept. La possession d’attributs nécessaires et suffisants est un indicateur plus faible de l’inclusion d’un objet dans une catégorie que la proximité des valeurs des attributs particulièrement saillants – marqueurs de la ressemblance familiale – avec celles du membre idéal de la catégorie. Par exemple, un chien candidat peut être classé ainsi en vertu de la proximité des attributs perceptifs clés avec ceux d’un « chien » idéal dans l’esprit de la personne qui le perçoit – fourrure, nombre de pattes, taille, forme de la tête, etc. L’application de catégories sur la base de ressemblances familiales plutôt que d’attributs critériels suggère que, du moins dans les circonstances quotidiennes, l’application de concepts est une affaire vague et sujette aux erreurs, guidée par une heuristique floue plutôt que par une adhésion stricte aux conditions de définition. De plus, par implication, l’application de concepts fait partie de l’apprentissage – l’utilisation répétée de concepts aboutit à des prototypes qui sont plus cohérents avec ceux utilisés par d’autres utilisateurs de concepts. Cela suggère une forte dimension normative et consensuelle de l’utilisation des concepts. Enfin, Rosch (1975) a postulé qu’il existe des « catégories sémantiques de base », contenant les concepts les plus proches de l’expérience et de la cognition humaines. Les catégories superordonnées ont des caractéristiques moins contrastées, tandis que les catégories subordonnées ont des caractéristiques moins communes – ainsi, les catégories de base ont tendance à être celles avec des instances prototypiques plus clairement identifiables, et ont donc tendance à être privilégiées dans l’apprentissage et l’utilisation des concepts.
Alors que les modèles de réseaux sémantiques et de prototypes fournissent des théories descriptives évocatrices qui semblent capturer des caractéristiques plus intuitives de la catégorisation, ils fournissent relativement peu d’explications causales sur la façon dont des groupes particuliers de concepts en viennent à être organisés cognitivement. Plusieurs nouvelles théories ont été développées dans les années 1980 avec un accent plus explicatif (Komatsu 1992). Medin et Schaffer (1978), par exemple, proposent une théorie du « contexte » basée sur des exemples, rivale de la théorie des prototypes, qui évite le naturalisme inhérent à l’identification catégorielle de « niveau de base » pour privilégier un rôle plus actif de la cognition dans la conception de « stratégies et d’hypothèses » lors de la récupération de candidats exemplaires de catégories mémorisées. L’utilisation des concepts implique donc que les agents ne se contentent pas de naviguer dans une hiérarchie conceptuelle ou d’observer des ressemblances de famille perceptives lorsqu’ils appliquent des concepts ; ils formulent aussi activement des théories dérivées du contexte actuel et s’appuient sur des connexions associatives entre les candidats aux concepts et d’autres concepts associés. Dans ce modèle, l’utilisation des concepts implique une théorisation scientifique ; dans des variantes ultérieures, le modèle devient une « théorie théorique » (Medin 1989). Comme le dit un partisan :
En particulier, les enfants développent des systèmes abstraits et cohérents d’entités et de règles, notamment des entités et des règles causales. C’est-à-dire qu’ils développent des théories. Ces théories permettent aux enfants de faire des prédictions sur de nouvelles preuves, d’interpréter des preuves et d’expliquer des preuves. Les enfants expérimentent et explorent activement le monde, en testant les prédictions de la théorie et en rassemblant les preuves pertinentes. Certaines preuves contraires à la théorie sont simplement réinterprétées en termes de théorie. Cependant, lorsque de nombreuses prédictions de la théorie sont falsifiées, l’enfant commence à chercher des théories alternatives. Si l’alternative fait un meilleur travail de prédiction et d’explication des preuves, elle remplace la théorie existante (Gopnik 2003, p. 240).
La recherche empirique sur le développement cognitif chez les enfants (Gopnik 2003) et les comparaisons interculturelles de l’organisation et de la préférence conceptuelles (Atran et al. 1999 ; Medin et al. 2006 ; Ross et Medin 2005) ont montré un fort soutien pour les comptes de » théorie théorique « . Le point de vue de Quine sur la science en tant que » sens commun conscient de soi » fournit une autre forme de soutien philosophique à ce point de vue.
Pour les besoins de cette étude, une force du compte de la » théorie de la théorie » est son orientation vers l’holisme conceptuel et le schématisme – les concepts ne se rapportent pas simplement aux objets dans le monde, selon ce point de vue (bien qu’il soit certain qu’ils le fassent aussi) ; ils se tiennent également dans un appareil dynamique, explicatif, avec d’autres concepts, relations et règles. En outre, les théories sont utilisées par les agents non seulement pour expliquer les phénomènes à eux-mêmes, mais aussi aux autres ; l’utilisation des concepts joue donc un rôle à la fois dans la manière dont chacun se fait une idée du monde et dans la manière dont chacun décrit, explique, justifie et communique avec les autres. En bref, les concepts sont compris comme étant non seulement en relation avec les objets du monde, comme le voudrait une théorie de la correspondance ; ils sont en relation les uns avec les autres, pour former des explications mentales au moins localement cohérentes ; et ils lient également les utilisateurs participants en communautés et en cultures. Le compte rendu présenté ici s’appuie de la même manière sur les notions complémentaires de cohérence et de consensualité de la vérité pour expliquer la commensurabilité.