Theorieën over categorisatie
Een manier om kennissystemen te beschouwen is als formele mechanismen voor het classificeren en categoriseren van objecten. Grafisch lijkt een typische ontologie op een hiërarchische taxonomie – hoewel zij technisch gezien een gerichte acyclische grafiek is, wat betekent dat concepten meer dan één “ouder” kunnen hebben, evenals meerdere “broers en zussen” en “kinderen”. (Ontologieën kunnen ook andere soorten conceptuele relaties ondersteunen, maar de subsumptierelatie is rechtstreeks in de semantiek van de OWL geaxiomatiseerd, net als verscheidene andere relaties). In dergelijke systemen berust de toepassing van concepten op objecten die voldoen aan noodzakelijke en voldoende voorwaarden voor het lidmaatschap van een klasse. Dit algemene model komt goed overeen met de brede traditie van categorie-toepassing die teruggaat tot Aristoteles. Ontologieën zijn echter bedoeld als machine-georiënteerde representaties van conceptualisaties, met slechts een analoge relatie tot mentale cognitieve modellen. Wat kunnen we dan afleiden uit hedendaagse theorieën over categorisatie?
Sinds de zestiger jaren zijn alternatieve modellen voorgesteld voor de wijze waarop mentale concepten worden georganiseerd en toegepast. Net als ontologieën modelleren semantische netwerken, ontwikkeld door Quillian (1967), cognitieve conceptuele netwerken als gerichte grafieken, waarbij concepten verbonden zijn door associatieve eenrichtingslinks. In tegenstelling tot ontologieën impliceren deze links geen logische (of ander) soort relatie tussen de concepten, alleen dat er een algemene associatie bestaat. Semantische netwerken werden aangepast voor vroege kennisrepresentatiesystemen, zoals framesystemen, die gebruik maken van dezelfde grafische structuur van conceptuele knooppunten en links: We kunnen een frame beschouwen als een netwerk van knooppunten en relaties’ (Minsky 1974). Minsky merkt ook expliciet de gelijkenis op tussen framesystemen en Kuhniaanse paradigma’s – wat voortvloeit uit de constructie van een framesysteem als een gezichtspunt van een stukje van de wereld. Bij uitbreiding kunnen semantische netwerken gezien worden als proto-paradigma’s in de Kuhniaanse zin, hoewel het niet duidelijk is wat de grenzen tussen het ene en het andere netwerk zouden kunnen zijn – deze analogie moet dus niet te ver doorgetrokken worden.
Een kenmerk van semantische netwerken is het gebrek aan onderliggend logisch formalisme. Hoewel Minsky’s framesystemen en andere analogieën in de jaren ’70 werden ‘geüpdatet’ met formele semantische lagen, met name door de ontwikkeling van beschrijvingslogica in de jaren ’80, is volgens Minsky het ontbreken van formele apparatuur eerder een ‘kenmerk’ dan een ‘fout’ – het opleggen van controles op consistentie leggen bijvoorbeeld een onrealistische beperking op aan pogingen om menselijke soorten kennis te representeren, juist omdat mensen zelden consistent zijn in hun gebruik van concepten (Minsky 1974). In het beste geval moeten ze consistent zijn over een gelokaliseerd deel van hun cognitief semantisch netwerk, relevant voor een bepaald probleem, en de bijbehorende concepten en redeneringen die nodig zijn om het aan te pakken. Evenzo merken de auteurs van semantische netwerkmodellen op hoe moeilijk het is om netjes gestructureerde grafieken als model te nemen voor de mentale conceptuele organisatie: “Woordenboekdefinities zijn niet erg ordelijk en we betwijfelen of het menselijk geheugen, dat veel rijker is, zelfs maar even ordelijk is als een woordenboek” (Collins en Quillian 1969). Semantische netwerken vertegenwoordigen een vroeg – en blijvend – model van cognitie, dat nog steeds invloedrijk is in geactualiseerde modellen zoals neurale netwerken en parallelle gedistribueerde verwerking (Rogers en McClelland 2004). Dergelijke netwerken vertonen ook twee kenmerken die van belang zijn voor de hier aangenomen theorie: ten eerste, de nadruk op structurele, connectionistische modellen van cognitie – dat concepten niet alleen kwantitatief worden geaccumuleerd als ingangen in een cognitief woordenboek, maar ook onderling verbonden zijn, zodat de toevoeging van nieuwe concepten een kwalitatief verschil maakt in hoe bestaande concepten worden toegepast; en ten tweede, de impliciete coherentie van netwerken, die suggereert dat concepten niet louter lukraak worden gerangschikt, maar samenhangende en verklarende schema’s of structuren vormen.
In het midden van de jaren zeventig werd de prototypetheorie, een ander cognitief model, voorgesteld om het gebruik van concepten te beschrijven. Voortbouwend op Wittgensteins ontwikkeling van “taalspelen” (Wittgenstein 1967), toonde Rosch (1975) door middel van een reeks empirische experimenten aan dat het proces van classificatie van objecten onder conceptuele labels in het algemeen niet werd ondernomen door te zoeken naar noodzakelijke en voldoende voorwaarden voor concept-zijn. In plaats daarvan worden concepten toegepast op basis van overeenkomsten tussen een waargenomen object en een conceptueel ‘prototype’ – een typische of exemplarische instantie van een concept. Het hebben van noodzakelijke en voldoende attributen is een zwakkere indicator voor het opnemen van een object in een categorie dan de nabijheid van de waarden van bijzonder opvallende attributen – kenmerken van familiegelijkenis – bij die van het ideale categorielid. Bijvoorbeeld, een kandidaat-hond kan als zodanig worden geclassificeerd op grond van de nabijheid van de belangrijkste waarneembare attributen bij die van een ideale “hond” in de geest van de waarnemer – bont, aantal poten, grootte, vorm van de kop, enzovoort. Het toepassen van categorieën op basis van familiegelijkenissen in plaats van op basis van criteria suggereert dat, tenminste in alledaagse omstandigheden, het toepassen van concepten een vage en foutgevoelige aangelegenheid is, die eerder geleid wordt door vage heuristieken dan door het strikt naleven van definitionele voorwaarden. Dit impliceert ook dat concepttoepassing deel uitmaakt van leren – herhaald gebruik van concepten leidt tot prototypes die meer consistent zijn met die van andere conceptgebruikers. Dit zou wijzen op een sterke normatieve en consensuele dimensie van conceptgebruik. Tenslotte stelde Rosch (1975) dat er “semantische basiscategorieën” bestaan, die concepten bevatten die het dichtst bij de menselijke ervaring en cognitie staan. Superordinate categorieën hebben minder contrasterende kenmerken, terwijl subordinate categorieën minder gemeenschappelijke kenmerken hebben – vandaar dat basiscategorieën de neiging hebben om die te zijn met duidelijker identificeerbare prototypische gevallen, en zo de neiging hebben om bevoorrecht te zijn in conceptleren en -gebruik.
Terwijl semantische netwerk- en prototypemodellen suggestieve beschrijvende theorieën bieden die meer intuïtieve kenmerken van categorisatie lijken te vatten, bieden ze relatief weinig causale verklaring van hoe bepaalde clusters van concepten cognitief georganiseerd worden. In de jaren tachtig werden verschillende nieuwe theorieën ontwikkeld met een sterkere verklarende nadruk (Komatsu 1992). Medin en Schaffer (1978), bijvoorbeeld, stellen een op voorbeelden gebaseerde ‘context’ theorie voor die rivaliseert met de prototypetheorie, en die het inherente naturalisme van categoriale identificatie op ‘basisniveau’ verruilt voor een actievere rol van de cognitie in het bedenken van ‘strategieën en hypothesen’ bij het ophalen van gememoriseerde categorievoorbeeldkandidaten. Conceptgebruik houdt dus in dat agenten niet alleen door een conceptuele hiërarchie navigeren of perceptuele familiegelijkenissen waarnemen wanneer ze concepten toepassen; ze formuleren ook actief theorieën die zijn afgeleid uit de huidige context, en putten uit associatieve verbanden tussen conceptkandidaten en andere geassocieerde concepten. In dit model houdt conceptgebruik wetenschappelijke theorievorming in; in latere varianten wordt het model “theorievorming” (Medin 1989). Zoals een voorstander het formuleert:
In het bijzonder ontwikkelen kinderen abstracte, samenhangende systemen van entiteiten en regels, in het bijzonder causale entiteiten en regels. Dat wil zeggen, ze ontwikkelen theorieën. Deze theorieën stellen kinderen in staat om voorspellingen te doen over nieuw bewijsmateriaal, om bewijsmateriaal te interpreteren en om bewijsmateriaal te verklaren. Kinderen experimenteren actief met de wereld en verkennen deze, testen de voorspellingen van de theorie en verzamelen relevant bewijsmateriaal. Sommige tegenbewijzen van de theorie worden eenvoudigweg geherinterpreteerd in termen van de theorie. Uiteindelijk, echter, wanneer veel voorspellingen van de theorie worden vervalst, begint het kind alternatieve theorieën te zoeken. Als het alternatief het bewijs beter voorspelt en verklaart, vervangt het de bestaande theorie (Gopnik 2003, p. 240).
Empirisch onderzoek naar de cognitieve ontwikkeling bij kinderen (Gopnik 2003) en interculturele vergelijkingen van conceptuele organisatie en voorkeur (Atran e.a. 1999; Medin e.a. 2006; Ross en Medin 2005) heeft sterke steun aangetoond voor ’theorie-theorie’-rekeningen. Quine’s opvatting van wetenschap als ‘zelfbewust gezond verstand’ biedt een verdere vorm van filosofische ondersteuning voor deze opvatting.
Voor de doeleinden van deze studie is een sterk punt van de ’theorie-theorie’-rekening haar oriëntatie op conceptueel holisme en schematisme-concepten hebben volgens deze opvatting niet alleen betrekking op objecten in de wereld (hoewel ze dat zeker ook doen); ze staan ook binnen een dynamisch, verklarend apparaat, met andere concepten, relaties en regels. Bovendien worden theorieën door agenten niet alleen gebruikt om verschijnselen aan zichzelf te verklaren, maar ook aan anderen; het gebruik van concepten speelt dan zowel een rol in iemands eigen betekenisgeving aan de wereld, als ook in de manier waarop iemand beschrijft, verklaart, rechtvaardigt en met anderen communiceert. Kortom, concepten staan niet alleen in relatie tot objecten in de wereld, zoals een correspondentietheorie het wil; ze staan in relatie tot elkaar, om ten minste lokaal coherente mentale verklaringen te vormen; en ze binden ook deelnemende gebruikers tot gemeenschappen en culturen. De hier gepresenteerde uiteenzetting maakt op soortgelijke wijze gebruik van aanvullende coherentistische en consensuele noties van waarheid om de commensurabiliteit te verklaren.