Teorías de categorización
Una forma de considerar los sistemas de conocimiento es como mecanismos formales para clasificar y categorizar objetos. Gráficamente, una ontología típica se parece a una taxonomía jerárquica, aunque, técnicamente, es un gráfico acíclico dirigido, lo que significa que los conceptos pueden tener más de un «padre», así como múltiples «hermanos» e «hijos». (Las ontologías también pueden admitir otros tipos de relaciones conceptuales, pero la relación de subsunción está axiomatizada en la semántica de OWL directamente, al igual que otras relaciones). En estos sistemas, la aplicación de los conceptos depende de que los objetos cumplan las condiciones necesarias y suficientes para ser miembros de una clase. Este modelo general concuerda con la amplia tradición de aplicación de categorías que se remonta a Aristóteles. Sin embargo, las ontologías pretenden ser representaciones de conceptualizaciones orientadas a la máquina, con una relación sólo analógica con los modelos cognitivos mentales. Desde la década de 1960 se han propuesto modelos alternativos sobre cómo se organizan y aplican los conceptos mentales. Al igual que las ontologías, las redes semánticas, iniciadas por Quillian (1967), modelan las redes conceptuales cognitivas como grafos dirigidos, con conceptos conectados por enlaces asociativos unidireccionales. A diferencia de las ontologías, estos enlaces no implican ningún tipo de relación lógica (o de otro tipo) entre los conceptos, sino que existe una asociación general. Las redes semánticas se adaptaron a los primeros sistemas de representación del conocimiento, como los sistemas de marcos, que utilizan la misma estructura gráfica de nodos y enlaces conceptuales: Podemos pensar en un marco como una red de nodos y relaciones» (Minsky 1974). Minsky también señala explícitamente la similitud entre los sistemas de marcos y los paradigmas kuhnianos, lo que resulta de la construcción de un sistema de marcos como punto de vista de una porción del mundo. Por extensión, las redes semánticas pueden ser vistas como protoparadigmas en el sentido kuhniano, aunque no está claro cuáles podrían ser los límites entre una red y otra-esta analogía no debería, entonces, ser exagerada.
Una característica de las redes semánticas es la falta de formalismo lógico subyacente. Mientras que los sistemas de marcos minskianos y otros análogos en la década de 1970 fueron «actualizados» con capas semánticas formales, especialmente a través del desarrollo de la lógica de la descripción en la década de 1980, según Minsky la falta de un aparato formal es una «característica» más que un «error» -la imposición de controles de consistencia, por ejemplo, impone una restricción poco realista en los intentos de representar los tipos de conocimiento humano, precisamente porque los seres humanos rara vez son consistentes en su uso de los conceptos (Minsky 1974). En el mejor de los casos, se les exige que sean coherentes en una parte localizada de su red semántica cognitiva, relevante para un problema determinado, y los conceptos y razonamientos asociados necesarios para manejarlo. Del mismo modo, los autores de los modelos de redes semánticas señalan la dificultad de suponer que los gráficos claramente estructurados modelen la organización conceptual mental: «Las definiciones de los diccionarios no son muy ordenadas y dudamos que la memoria humana, que es mucho más rica, sea incluso tan ordenada como un diccionario» (Collins y Quillian 1969). Las redes semánticas representan un primer -y duradero- modelo de cognición, que sigue influyendo en modelos actualizados como las redes neuronales y el procesamiento distribuido paralelo (Rogers y McClelland 2004). Dichas redes también presentan dos características relevantes para la teoría adoptada aquí: en primer lugar, el énfasis en los modelos estructurales y conexionistas de la cognición -que los conceptos no se acumulan meramente de forma cuantitativa como entradas en un diccionario cognitivo, sino que también están interconectados, de modo que la adición de nuevos conceptos supone una diferencia cualitativa en la forma en que se aplican los conceptos existentes-; y en segundo lugar, la coherencia implícita de las redes, que sugiere que los conceptos no se organizan meramente al azar, sino que forman esquemas o estructuras coherentes y explicativas.
A mediados de la década de 1970 se propuso la teoría de los prototipos, otro modelo cognitivo, para describir el uso de los conceptos. Basándose en el desarrollo de los «juegos de lenguaje» de Wittgenstein (Wittgenstein 1967), Rosch (1975) demostró, mediante una serie de experimentos empíricos, que el proceso de clasificación de objetos bajo etiquetas conceptuales no se realizaba, en general, buscando las condiciones necesarias y suficientes para ser un concepto. Más bien, los conceptos se aplican basándose en las similitudes entre un objeto percibido y un «prototipo» conceptual, una instancia típica o ejemplar de un concepto. La posesión de atributos necesarios y suficientes es un indicador más débil para la inclusión de un objeto en una categoría que la proximidad de los valores de los atributos especialmente destacados -marcadores del parecido familiar- con los del miembro ideal de la categoría. Por ejemplo, un perro candidato podría clasificarse así en virtud de la proximidad de los atributos perceptivos clave a los de un «perro» ideal en la mente del perceptor: pelo, número de patas, tamaño, forma de la cabeza, etc. La aplicación de las categorías sobre la base de los parecidos familiares, en lugar de los atributos criteriales, sugiere que, al menos en las circunstancias cotidianas, la aplicación de los conceptos es un asunto vago y propenso a los errores, guiado por una heurística difusa más que por la adhesión estricta a las condiciones de definición. Además, por implicación, la aplicación de conceptos forma parte del aprendizaje: el uso repetido de conceptos da lugar a prototipos más coherentes con los utilizados por otros usuarios de conceptos. Esto sugiere una fuerte dimensión normativa y consensual en el uso de los conceptos. Por último, Rosch (1975) postuló que existen «categorías semánticas de nivel básico», que contienen los conceptos más próximos a la experiencia y la cognición humanas. Las categorías superordinadas tienen menos rasgos contrastivos, mientras que las categorías subordinadas tienen rasgos menos comunes; por lo tanto, las categorías básicas tienden a ser las que tienen instancias prototípicas más claramente identificables y, por lo tanto, tienden a ser privilegiadas en el aprendizaje y el uso de los conceptos.
Aunque los modelos de redes semánticas y de prototipos proporcionan teorías descriptivas evocadoras que parecen captar rasgos más intuitivos de la categorización, proporcionan relativamente poca explicación causal de cómo determinados grupos de conceptos llegan a organizarse cognitivamente. En la década de 1980 se desarrollaron varias teorías nuevas con un mayor énfasis explicativo (Komatsu 1992). Medin y Schaffer (1978), por ejemplo, proponen una teoría del «contexto» basada en los ejemplos, que rivaliza con la teoría de los prototipos, y que evita el naturalismo inherente a la identificación categorial de «nivel básico» en favor de un papel más activo de la cognición en el diseño de «estrategias e hipótesis» cuando se recuperan las categorías candidatas memorizadas. El uso de los conceptos, por tanto, implica que los agentes no se limitan a navegar por una jerarquía conceptual o a observar los parecidos perceptivos de la familia cuando aplican los conceptos; también formulan activamente teorías derivadas del contexto actual y recurren a conexiones asociativas entre los candidatos a concepto y otros conceptos asociados. En este modelo, el uso de conceptos implica una teorización científica; en variantes posteriores, el modelo se convierte en «teoría de la teoría» (Medin 1989). Como dice uno de sus defensores:
En particular, los niños desarrollan sistemas abstractos y coherentes de entidades y reglas, particularmente entidades y reglas causales. Es decir, desarrollan teorías. Estas teorías permiten a los niños hacer predicciones sobre las nuevas pruebas, interpretarlas y explicarlas. Los niños experimentan y exploran activamente el mundo, poniendo a prueba las predicciones de la teoría y reuniendo las pruebas pertinentes. Algunas pruebas contrarias a la teoría simplemente se reinterpretan en términos de la teoría. Sin embargo, cuando muchas de las predicciones de la teoría son falsas, el niño empieza a buscar teorías alternativas. Si la alternativa predice y explica mejor las pruebas, sustituye a la teoría existente (Gopnik 2003, p. 240).
La investigación empírica sobre el desarrollo cognitivo de los niños (Gopnik 2003) y las comparaciones transculturales de la organización conceptual y la preferencia (Atran et al. 1999; Medin et al. 2006; Ross y Medin 2005) han mostrado un fuerte apoyo a las cuentas de la «teoría». El punto de vista de Quine sobre la ciencia como «sentido común autoconsciente» proporciona otra forma de apoyo filosófico a este punto de vista.
Para los propósitos de este estudio, un punto fuerte de la cuenta de la «teoría de la teoría» es su orientación hacia el holismo conceptual y el esquematismo – los conceptos no se relacionan simplemente con los objetos en el mundo, según este punto de vista (aunque ciertamente también lo hacen); también están dentro de un aparato dinámico, explicativo, con otros conceptos, relaciones y reglas. Además, los agentes utilizan las teorías no para explicarse a sí mismos los fenómenos, sino también a los demás; el uso de los conceptos tiene, pues, un papel tanto en la propia percepción del mundo como en la forma de describir, explicar, justificar y comunicarse con los demás. En resumen, se entiende que los conceptos no sólo se relacionan con los objetos del mundo, como lo haría una teoría de la correspondencia; se relacionan entre sí, para formar explicaciones mentales al menos localmente coherentes; y también unen a los usuarios participantes en comunidades y culturas. El relato que aquí se presenta se basa igualmente en las nociones complementarias de coherencia y consenso de la verdad para explicar la conmensurabilidad.