A kategorizálás elméletei
A tudásrendszerek egyik módja a tárgyak osztályozásának és kategorizálásának formális mechanizmusai. Grafikusan egy tipikus ontológia egy hierarchikus taxonómiához hasonlít – bár technikailag egy irányított aciklikus gráf, ami azt jelenti, hogy a fogalmaknak több “szülőjük”, valamint több “testvérük” és “gyermekük” is lehet. (Az ontológiák másfajta fogalmi kapcsolatokat is támogathatnak, de az OWL szemantikájában közvetlenül axiomatizálva van a subsumciós kapcsolat, csakúgy, mint számos más kapcsolat). Az ilyen rendszerekben a fogalomalkalmazás azon alapul, hogy az objektumok megfelelnek az osztályhoz tartozás szükséges és elégséges feltételeinek. Ez az általános modell jól illeszkedik a kategóriaalkalmazás Arisztotelészig visszanyúló széleskörű hagyományához. Az ontológiák azonban a fogalomalkotások géporientált reprezentációi, amelyek csak analóg kapcsolatban állnak a mentális kognitív modellekkel. Mit lehet tehát megtudni a kategorizálás kortárs elméleteiből?
Az 1960-as évek óta alternatív modelleket javasoltak arra vonatkozóan, hogyan szerveződnek és alkalmazzák a mentális fogalmakat. Az ontológiákhoz hasonlóan a szemantikus hálózatok, amelyeknek úttörője Quillian (1967) volt, a kognitív fogalmi hálózatokat irányított gráfként modellezik, ahol a fogalmakat egyirányú asszociatív kapcsolatok kötik össze. Az ontológiákkal ellentétben ezek a kapcsolatok nem jelentenek semmiféle logikai (vagy más) kapcsolatot a fogalmak között, csak azt, hogy létezik egy általános kapcsolat. A szemantikus hálózatokat adaptálták a korai tudásreprezentációs rendszerekhez, például a keretrendszerekhez, amelyek ugyanezt a fogalmi csomópontokból és kapcsolatokból álló grafikus struktúrát használják: “A keretet csomópontok és kapcsolatok hálózatának tekinthetjük” (Minsky 1974). Minsky kifejezetten megjegyzi a keretrendszerek és a Kuhn-féle paradigmák közötti hasonlóságot is – ami a keretrendszer felépítéséből adódik, mint a világ egy szeletének nézőpontja. Tágabb értelemben a szemantikai hálózatokat tekinthetjük Kuhn-i értelemben vett proto-paradigmáknak, bár nem világos, hogy mik lehetnek a határok egyik hálózat és a másik között – ezt az analógiát tehát nem szabad túlfeszíteni.
A szemantikai hálózatok egyik jellemzője a mögöttes logikai formalizmus hiánya. Míg a minszki keretrendszerek és más analógiák az 1970-es években “frissültek” formális szemantikai rétegekkel, nevezetesen a leíró logikák 1980-as évekbeli fejlődésével, Minsky szerint a formális apparátus hiánya inkább “jellemző”, mint “hiba” – a konzisztencia-ellenőrzések előírása például irreális korlátot jelent az emberi tudásfajták reprezentálására tett kísérletekre, pontosan azért, mert az emberek ritkán következetesek a fogalomhasználatukban (Minsky 1974). A legjobb esetben is csak a kognitív szemantikai hálózatuk egy adott probléma szempontjából releváns, lokalizált részén, valamint a probléma kezeléséhez szükséges kapcsolódó fogalmak és következtetések tekintetében kell következetesnek lenniük. Hasonlóképpen a szemantikus hálózati modellek szerzői is megjegyzik, hogy nehéz azt feltételezni, hogy szépen strukturált gráfok modellezik a mentális fogalmi szerveződést: “A szótári definíciók nem túl rendezettek, és kételjük, hogy az emberi memória, amely sokkal gazdagabb, még annyira is rendezett, mint egy szótár” (Collins és Quillian 1969). A szemantikus hálózatok a megismerés korai – és tartós – modelljét képviselik, amely továbbra is hatással van az olyan frissített modellekre, mint a neurális hálózatok és a párhuzamos elosztott feldolgozás (Rogers és McClelland 2004). Az ilyen hálózatok két olyan jellemzőt is mutatnak, amelyek relevánsak az itt elfogadott elmélet szempontjából: először is, a megismerés strukturális, konnekcionista modelljeinek hangsúlyozása – hogy a fogalmak nem csupán kvantitatív módon halmozódnak fel, mint a kognitív szótár bejegyzései, hanem össze is kapcsolódnak, így az új fogalmak hozzáadása minőségi különbséget jelent a meglévő fogalmak alkalmazásában; másodszor, a hálózatok implikált koherenciája, amely azt sugallja, hogy a fogalmak nem csupán véletlenszerűen vannak elrendezve, hanem koherens és magyarázó sémákat vagy struktúrákat alkotnak.
A hetvenes évek közepén egy másik kognitív modellt, a prototípuselméletet javasolták a fogalomhasználat leírására. Rosch (1975) Wittgenstein “nyelvi játékok” (Wittgenstein 1967) kidolgozására építve egy sor empirikus kísérlettel bizonyította, hogy a tárgyak fogalmi címkék alá sorolásának folyamata általában nem a fogalommá válás szükséges és elégséges feltételeinek keresésével történik. A fogalmak alkalmazása inkább az észlelt tárgy és egy fogalmi “prototípus” – egy fogalom tipikus vagy példaértékű példánya – közötti hasonlóságok alapján történik. A szükséges és elégséges tulajdonságok birtoklása gyengébb mutatója a tárgy kategóriába sorolásának, mint a különösen feltűnő tulajdonságok – a családi hasonlóság jelzői – értékeinek közelítése a kategória ideális tagjának értékeihez. Például egy kutyajelöltet az alapján lehet így besorolni, hogy a legfontosabb észlelési attribútumok közel állnak az észlelő fejében lévő ideális “kutya” attribútumaihoz – szőrzet, lábak száma, méret, fejforma és így tovább. A kategóriáknak a családi hasonlóságok, nem pedig a kritériumok alapján történő alkalmazása azt sugallja, hogy – legalábbis a mindennapi körülmények között – a fogalomalkalmazás homályos és hibalehetőségekkel teli ügy, amelyet inkább homályos heurisztikák irányítanak, mint a definíciós feltételek szigorú betartása. Következésképpen a fogalomalkalmazás része a tanulásnak is – a fogalmak ismételt használata olyan prototípusokat eredményez, amelyek konzisztensebbek a más fogalomhasználók által használtakkal. Ez a fogalomhasználat erős normatív és konszenzusos dimenziójára utal. Végül Rosch (1975) azt állította, hogy léteznek “alapszintű szemantikai kategóriák”, amelyek az emberi tapasztalathoz és megismeréshez legközelebb álló fogalmakat tartalmazzák. A felsőbbrendű kategóriák kevésbé kontrasztos jellemzőkkel rendelkeznek, míg az alárendelt kategóriák kevésbé közös jellemzőkkel – ezért az alapszintű kategóriák általában azok, amelyeknek világosabban azonosítható prototípusos példányai vannak, és így a fogalomtanulás és -használat során előnyt élveznek.
Míg a szemantikus hálózat és a prototípus modellek felidéző leíró elméleteket nyújtanak, amelyek látszólag megragadják a kategorizáció intuitívabb jellemzőit, viszonylag kevés oksági magyarázatot adnak arra, hogy a fogalmak egyes klasztereit hogyan szervezik meg kognitívan. Az 1980-as években több új elméletet dolgoztak ki erősebb magyarázó hangsúlyt helyezve (Komatsu 1992). Medin és Schaffer (1978) például a prototípus-elmélet riválisának számító, példán alapuló “kontextus” elméletet javasol, amely elveti az “alapszintű” kategorikus azonosítás eredendő naturalizmusát a megismerés aktívabb szerepe helyett a “stratégiák és hipotézisek” kidolgozásában a memorizált kategóriapéldány-jelöltek előhívása során. A fogalomhasználat során tehát az ágensek nem csupán a fogalmi hierarchiában navigálnak, vagy a fogalmak alkalmazása során megfigyelik a perceptuális családi hasonlóságokat; aktívan megfogalmazzák a jelen kontextusból származó elméleteket, és asszociatív kapcsolatokra támaszkodnak a fogalomjelöltek és más kapcsolódó fogalmak között. Ebben a modellben a fogalomhasználat tudományos elméletalkotást foglal magában; későbbi változatokban a modell “elméletelméletté” válik (Medin 1989). Ahogy az egyik képviselője fogalmaz:
A gyermekek különösen az entitások és szabályok, különösen az oksági entitások és szabályok absztrakt, összefüggő rendszereit alakítják ki. Vagyis elméleteket fejlesztenek. Ezek az elméletek lehetővé teszik a gyermekek számára, hogy előrejelzéseket tegyenek az új bizonyítékokkal kapcsolatban, hogy értelmezzék a bizonyítékokat, és hogy megmagyarázzák a bizonyítékokat. A gyermekek aktívan kísérleteznek és felfedezik a világot, tesztelik az elmélet előrejelzéseit, és releváns bizonyítékokat gyűjtenek. Az elmélettel ellentétes bizonyítékokat egyszerűen újraértelmezik az elmélet szempontjából. Végül azonban, amikor az elmélet számos előrejelzését megcáfolják, a gyermek elkezd alternatív elméleteket keresni. Ha az alternatív jobban előrejelzi és magyarázza a bizonyítékokat, akkor a meglévő elmélet helyébe lép (Gopnik 2003, 240. o.).
A gyermekek kognitív fejlődésével kapcsolatos empirikus kutatások (Gopnik 2003) és a fogalmi szerveződés és preferencia kultúrák közötti összehasonlításai (Atran et al. 1999; Medin et al. 2006; Ross és Medin 2005) erős támogatást mutattak az “elmélet-elmélet” számláknak. Quine nézete a tudományról mint “öntudatos józan észről” egy további filozófiai megerősítést nyújt ennek a nézetnek.
A jelen tanulmány szempontjából az “elméletelméleti” beszámoló egyik erőssége a fogalmi holizmus és sematizmus felé való irányultsága – e nézet szerint a fogalmak nem csupán a világ tárgyaira vonatkoznak (bár kétségtelenül ezt is teszik); egy dinamikus, magyarázó apparátusban is állnak, más fogalmakkal, kapcsolatokkal és szabályokkal. Ráadásul az elméleteket az ágensek nem arra használják, hogy a jelenségeket önmaguknak, hanem másoknak is megmagyarázzák; a fogalomhasználatnak tehát szerepe van mind a világ saját értelmezésében, mind pedig abban, ahogyan az ember leírja, magyarázza, indokolja és kommunikálja másokkal. Röviden, a fogalmak nem csak a világ tárgyaihoz viszonyítva értendők, ahogyan azt a korrespondenciaelmélet tenné; egymáshoz viszonyítva állnak, hogy legalább helyileg koherens mentális magyarázatokat alkossanak; és a résztvevő felhasználókat közösségekbe és kultúrákba kötik össze. Az itt bemutatott beszámoló hasonló módon támaszkodik az igazság kiegészítő koherencialista és konszenzusos felfogására, hogy megmagyarázza a komensurabilitást.