Teorie della categorizzazione
Un modo di considerare i sistemi di conoscenza è come meccanismi formali per classificare e categorizzare gli oggetti. Graficamente, una tipica ontologia assomiglia ad una tassonomia gerarchica – anche se, tecnicamente, è un grafo aciclico diretto, il che significa che i concetti possono avere più di un singolo “genitore” così come più “fratelli” e “figli”. (Le ontologie possono anche supportare altri tipi di relazioni concettuali, ma la relazione di sussunzione è assiomatizzata direttamente nella semantica dell’OWL, così come diverse altre relazioni). In tali sistemi, l’applicazione dei concetti si basa su oggetti che soddisfano condizioni necessarie e sufficienti per l’appartenenza alla classe. Questo modello generale si accorda bene con l’ampia tradizione di applicazione delle categorie che risale ad Aristotele. Tuttavia, le ontologie sono intese come rappresentazioni di concettualizzazioni orientate alla macchina, con solo una relazione analogica con i modelli cognitivi mentali. Cosa si può dunque ricavare dalle teorie contemporanee della categorizzazione?
Dagli anni ’60 sono stati proposti modelli alternativi per organizzare e applicare i concetti mentali. Come le ontologie, le reti semantiche, pioniere di Quillian (1967), modellano le reti concettuali cognitive come grafi diretti, con concetti collegati da collegamenti associativi unidirezionali. A differenza delle ontologie, questi collegamenti non implicano alcun tipo di relazione logica (o di altro tipo) tra i concetti, ma solo che esiste un’associazione generale. Le reti semantiche sono state adattate ai primi sistemi di rappresentazione della conoscenza, come i sistemi di frame, che utilizzano la stessa struttura grafica di nodi concettuali e collegamenti: Possiamo pensare a un frame come a una rete di nodi e relazioni” (Minsky 1974). Minsky nota anche esplicitamente la somiglianza tra i sistemi di frame e i paradigmi kuhniani – ciò che risulta dalla costruzione di un sistema di frame come punto di vista di una fetta di mondo. Per estensione, le reti semantiche possono essere viste come proto-paradigmi in senso kuhniano, anche se non è chiaro quali possano essere i limiti tra una rete e l’altra – questa analogia non dovrebbe, quindi, essere troppo forzata.
Una caratteristica delle reti semantiche è la mancanza di un formalismo logico sottostante. Mentre i sistemi di frame minskiani e altri analoghi negli anni ’70 sono stati “aggiornati” con strati semantici formali, in particolare attraverso lo sviluppo di logiche di descrizione negli anni ’80, secondo Minsky la mancanza di un apparato formale è una “caratteristica” piuttosto che un “bug” – l’imposizione di controlli sulla coerenza, per esempio, impone un vincolo irrealistico ai tentativi di rappresentare i tipi umani di conoscenza, proprio perché gli umani sono raramente coerenti nel loro uso dei concetti (Minsky 1974). Al massimo si richiede loro di essere coerenti attraverso una porzione localizzata della loro rete semantica cognitiva, rilevante per un dato problema a portata di mano, e i concetti associati e il ragionamento richiesto per gestirlo. Allo stesso modo, gli autori dei modelli di reti semantiche notano la difficoltà di assumere che grafici ordinatamente strutturati modellino l’organizzazione concettuale mentale: “Le definizioni dei dizionari non sono molto ordinate e dubitiamo che la memoria umana, che è molto più ricca, sia ordinata come un dizionario” (Collins e Quillian 1969). Le reti semantiche rappresentano un modello precoce e duraturo della cognizione, che continua ad essere influente in modelli aggiornati come le reti neurali e l’elaborazione parallela distribuita (Rogers e McClelland 2004). Tali reti mostrano anche due caratteristiche rilevanti per la teoria adottata qui: in primo luogo, l’enfasi sui modelli strutturali e connessionistici della cognizione – che i concetti non sono semplicemente accumulati quantitativamente come voci in un dizionario cognitivo, ma sono anche interconnessi, così che l’aggiunta di nuovi concetti fa una differenza qualitativa nel modo in cui i concetti esistenti sono applicati; e in secondo luogo, la coerenza implicita delle reti, che suggerisce che i concetti non sono semplicemente organizzati in modo casuale ma formano schemi o strutture coerenti ed esplicative.
A metà degli anni ’70 è stata proposta la teoria dei prototipi, un altro modello cognitivo, per descrivere l’uso dei concetti. Basandosi sullo sviluppo di Wittgenstein dei “giochi linguistici” (Wittgenstein 1967), Rosch (1975) dimostrò, attraverso una serie di esperimenti empirici, che il processo di classificazione degli oggetti sotto etichette concettuali non era generalmente intrapreso cercando le condizioni necessarie e sufficienti per l’esistenza dei concetti. Piuttosto, i concetti sono applicati sulla base di somiglianze tra un oggetto percepito e un “prototipo” concettuale – un’istanza tipica o esemplare di un concetto. Il possesso di attributi necessari e sufficienti è un indicatore più debole per l’inclusione di un oggetto all’interno di una categoria rispetto alla vicinanza dei valori di attributi particolarmente salienti – marcatori di somiglianza con quelli del membro ideale della categoria. Per esempio, un cane candidato potrebbe essere classificato così in virtù della vicinanza degli attributi percettivi chiave a quelli di un “cane” ideale nella mente di chi lo percepisce: pelo, numero di gambe, dimensioni, forma della testa e così via. L’applicazione di categorie sulla base di somiglianze familiari piuttosto che di attributi criteriali suggerisce che, almeno nelle circostanze quotidiane, l’applicazione dei concetti è un affare vago e soggetto a errori, guidato da euristiche sfocate piuttosto che da una stretta aderenza alle condizioni definitorie. Inoltre, implicitamente, l’applicazione dei concetti fa parte dell’apprendimento: l’uso ripetuto dei concetti produce prototipi che sono più coerenti con quelli usati da altri utenti di concetti. Questo suggerirebbe una forte dimensione normativa e consensuale nell’uso dei concetti. Infine, Rosch (1975) ha postulato che esistono “categorie semantiche di livello base”, contenenti i concetti più vicini all’esperienza e alla cognizione umana. Le categorie sovraordinate hanno caratteristiche meno contrastanti, mentre le categorie subordinate hanno caratteristiche meno comuni – quindi le categorie di base tendono ad essere quelle con istanze prototipiche più chiaramente identificabili, e quindi tendono ad essere privilegiate nell’apprendimento e nell’uso dei concetti.
Mentre le reti semantiche e i modelli prototipali forniscono teorie descrittive suggestive che sembrano catturare caratteristiche più intuitive della categorizzazione, forniscono relativamente poche spiegazioni causali su come particolari gruppi di concetti vengano organizzati cognitivamente. Diverse nuove teorie sono state sviluppate negli anni ’80 con una maggiore enfasi esplicativa (Komatsu 1992). Medin e Schaffer (1978), per esempio, propongono una teoria del “contesto” basata sugli esempi, rivale della teoria dei prototipi, che evita il naturalismo inerente all’identificazione categoriale del “livello base” per un ruolo più attivo della cognizione nell’escogitare “strategie e ipotesi” durante il recupero di candidati esemplari di categoria memorizzati. L’uso dei concetti, quindi, implica che gli agenti non si limitano a navigare in una gerarchia concettuale o a osservare le somiglianze percettive quando applicano i concetti; essi formulano anche attivamente teorie derivate dal contesto presente e attingono a connessioni associative tra i candidati concetti e altri concetti associati. In questo modello, l’uso dei concetti coinvolge la teorizzazione scientifica; in varianti successive, il modello diventa “teoria della teoria” (Medin 1989). Come dice un sostenitore:
In particolare, i bambini sviluppano sistemi astratti e coerenti di entità e regole, in particolare entità e regole causali. Cioè, sviluppano teorie. Queste teorie permettono ai bambini di fare previsioni su nuove prove, di interpretare le prove e di spiegare le prove. I bambini sperimentano ed esplorano attivamente il mondo, testando le previsioni della teoria e raccogliendo le prove pertinenti. Alcune prove contrarie alla teoria vengono semplicemente reinterpretate in termini di teoria. Alla fine, tuttavia, quando molte previsioni della teoria vengono falsificate, il bambino inizia a cercare teorie alternative. Se l’alternativa fa un lavoro migliore nel prevedere e spiegare l’evidenza, sostituisce la teoria esistente (Gopnik 2003, p. 240).
La ricerca empirica sullo sviluppo cognitivo nei bambini (Gopnik 2003) e i confronti interculturali dell’organizzazione e della preferenza concettuale (Atran et al. 1999; Medin et al. 2006; Ross e Medin 2005) hanno mostrato un forte sostegno ai conti della ‘teoria della teoria’. La visione di Quine della scienza come “senso comune autocosciente” fornisce un’ulteriore forma di sostegno filosofico a questa visione.
Per gli scopi di questo studio, un punto di forza dell’account della “teoria della teoria” è il suo orientamento verso l’olismo concettuale e lo schematismo: i concetti non si riferiscono semplicemente agli oggetti nel mondo, secondo questa visione (anche se sicuramente fanno anche questo); stanno anche all’interno di un apparato esplicativo dinamico, con altri concetti, relazioni e regole. Inoltre, le teorie sono usate dagli agenti non per spiegare i fenomeni a se stessi, ma anche agli altri; l’uso dei concetti ha quindi un ruolo sia nel proprio modo di dare un senso al mondo, sia nel modo in cui si descrive, spiega, giustifica e comunica con gli altri. In breve, i concetti sono intesi non solo in relazione agli oggetti del mondo, come vorrebbe una teoria della corrispondenza; essi stanno in relazione l’uno con l’altro, per formare spiegazioni mentali almeno localmente coerenti; e legano anche gli utenti partecipanti in comunità e culture. Il resoconto qui presentato attinge analogamente alle nozioni integrative coerentiste e consensuali di verità per spiegare la commensurabilità.