Semanttinen verkko

Kategorisointiteoriat

Yksi tapa tarkastella tietojärjestelmiä on tarkastella niitä muodollisina mekanismeina, joiden avulla kohteita luokitellaan ja kategorisoidaan. Graafisesti tyypillinen ontologia muistuttaa hierarkkista taksonomiaa – vaikkakin teknisesti se on suunnattu asyklinen graafi, mikä tarkoittaa, että käsitteillä voi olla useampia kuin yksi ”vanhempi” sekä useita ”sisaruksia” ja ”lapsia”. (Ontologiat voivat tukea myös muunlaisia käsitteellisiä suhteita, mutta subsumption-suhde on aksiomatisoitu suoraan OWL:n semantiikkaan, kuten monet muutkin suhteet). Tällaisissa järjestelmissä käsitteiden soveltaminen perustuu siihen, että objektit täyttävät luokkaan kuulumisen välttämättömät ja riittävät ehdot. Tämä yleinen malli sopii hyvin yhteen Aristoteleeseen asti ulottuvan luokan soveltamisen laajan perinteen kanssa. Ontologioiden on kuitenkin tarkoitus olla konesuuntautuneita käsitteellistämisen esityksiä, joilla on vain analoginen suhde mentaalisiin kognitiivisiin malleihin. Mitä sitten voidaan oppia nykyisistä kategorisointiteorioista?

1960-luvulta lähtien on ehdotettu vaihtoehtoisia malleja siitä, miten mentaaliset käsitteet organisoituvat ja miten niitä sovelletaan. Ontologioiden tapaan Quillianin (1967) uraauurtava semanttiset verkot mallintavat kognitiivisia käsiteverkkoja suunnattuina graafeina, joissa käsitteet ovat yhteydessä toisiinsa yksisuuntaisilla assosiatiivisilla linkeillä. Toisin kuin ontologioissa, nämä linkit eivät viittaa mihinkään loogiseen (tai muuhun) suhteeseen käsitteiden välillä, vaan ainoastaan siihen, että yleinen yhteys on olemassa. Semanttisia verkkoja mukautettiin varhaisiin tiedon esittämisjärjestelmiin, kuten kehysjärjestelmiin, joissa käytetään samaa käsitteellisten solmujen ja linkkien graafista rakennetta: ”Voimme ajatella kehystä solmujen ja suhteiden verkostona” (Minsky 1974). Minsky huomauttaa myös nimenomaisesti kehysjärjestelmien ja Kuhnin paradigmojen samankaltaisuudesta – siitä, mitä kehysjärjestelmän rakentamisesta syntyy näkökulmana jostakin maailman palasesta. Laajemmassa merkityksessä semanttisia verkkoja voidaan pitää proto-paradigmoina Kuhnin mielessä, vaikka ei olekaan selvää, mitkä voisivat olla yhden verkon ja toisen verkon väliset rajat – tätä analogiaa ei siis pidä liioitella.

Semanttisten verkkojen erityispiirteenä on taustalla olevan loogisen formalismin puute. Vaikka Minskin kehysjärjestelmiä ja muita analogioita ”päivitettiin” 1970-luvulla muodollisilla semanttisilla kerroksilla, erityisesti 1980-luvulla kehitettyjen kuvauslogiikoiden avulla, Minskyn mukaan muodollisen laitteiston puute on pikemminkin ”ominaisuus” kuin ”vika” – esimerkiksi johdonmukaisuuden tarkistusten asettaminen asettaa epärealistisen rajoituksen pyrkimyksille edustaa inhimillisiä tietämystyyppejä juuri siksi, että ihmiset ovat harvoin johdonmukaisia käsitteiden käytössään (Minsky 1974). Parhaimmillaan heidän edellytetään olevan johdonmukaisia kognitiivisen semanttisen verkostonsa paikallisessa osassa, joka liittyy tiettyyn käsillä olevaan ongelmaan ja siihen liittyviin käsitteisiin ja päättelyyn, joita tarvitaan sen käsittelemiseksi. Samoin semanttisten verkkomallien laatijat toteavat, että on vaikeaa olettaa, että siististi jäsennellyt graafit mallintavat mentaalista käsitteellistä organisaatiota: ”Sanakirjan määritelmät eivät ole kovin järjestelmällisiä, ja epäilemme, että ihmisen muisti, joka on paljon rikkaampi, on edes yhtä järjestelmällinen kuin sanakirja” (Collins ja Quillian 1969). Semanttiset verkot edustavat varhaista – ja kestävää – kognition mallia, joka vaikuttaa edelleen päivitetyissä malleissa, kuten neuroverkoissa ja rinnakkaisessa hajautetussa prosessoinnissa (Rogers ja McClelland 2004). Tällaisissa verkoissa on myös kaksi piirrettä, jotka ovat merkityksellisiä tässä omaksutun teorian kannalta: ensinnäkin kognition rakenteellisten, konnektionististen mallien korostaminen – käsitteitä ei kerry pelkästään kvantitatiivisesti kognitiivisen sanakirjan merkintöinä, vaan ne myös kytkeytyvät toisiinsa niin, että uusien käsitteiden lisääminen vaikuttaa laadullisesti siihen, miten olemassa olevia käsitteitä sovelletaan; ja toiseksi verkostojen oletettu johdonmukaisuus, joka viittaa siihen, etteivät käsitteet ole järjestäytyneet sattumanvaraisesti, vaan että ne muodostavat johdonmukaisia ja selittäviä skeemoja tai rakenteita.

1970-luvun puolivälissä ehdotettiin prototyyppiteoriaa, toista kognitiivista mallia, käsitteiden käytön kuvaamiseksi. Wittgensteinin kehittämän ”kielipelin” (Wittgenstein 1967) pohjalta Rosch (1975) osoitti useiden empiiristen kokeiden avulla, että objektien luokitteluprosessi käsitteellisten merkintöjen alle ei yleensä tapahdu etsimällä välttämättömiä ja riittäviä ehtoja käsitteellisyydelle. Pikemminkin käsitteitä sovelletaan havaitun kohteen ja käsitteellisen ”prototyypin” – tyypillisen tai esimerkillisen käsite-esimerkin – välisen samankaltaisuuden perusteella. Välttämättömien ja riittävien ominaisuuksien omaaminen on heikompi indikaattori kohteen sisällyttämiselle kategoriaan kuin se, miten lähellä kategorian ideaalijäsenen arvoja ovat erityisen silmiinpistävien ominaisuuksien arvot, jotka kuvaavat sukulaisuutta. Esimerkiksi koirakandidaatti saatetaan luokitella sellaiseksi sen perusteella, että keskeiset havaintomerkinnät – turkki, jalkojen lukumäärä, koko, pään muoto ja niin edelleen – ovat lähellä havaitsijan mielessä olevan ihanteellisen ”koiran” ominaisuuksia. Kategorioiden soveltaminen pikemminkin sukulaisuuksien kuin kriteeriominaisuuksien perusteella viittaa siihen, että ainakin jokapäiväisissä olosuhteissa käsitteiden soveltaminen on epämääräistä ja virhealtista, ja sitä ohjaavat pikemminkin epäselvät heuristiikat kuin määritelmäehtojen tiukka noudattaminen. Lisäksi käsitteiden soveltaminen on epäsuorasti osa oppimista – käsitteiden toistuva käyttö johtaa siihen, että prototyypit ovat johdonmukaisempia muiden käsitteiden käyttäjien käyttämien prototyyppien kanssa. Tämä viittaa siihen, että käsitteiden käytössä on vahva normatiivinen ja yhteisymmärrykseen perustuva ulottuvuus. Lopuksi Rosch (1975) esitti, että on olemassa ”perustason semanttisia kategorioita”, jotka sisältävät käsitteitä, jotka ovat lähimpänä ihmisen kokemusta ja kognitiota. Ylemmän tason kategorioilla on vähemmän kontrastisia piirteitä, kun taas alemman tason kategorioilla on vähemmän yhteisiä piirteitä – näin ollen peruskategoriat ovat yleensä niitä, joilla on selkeämmin tunnistettavia prototyyppisiä esiintymiä, ja näin ollen niillä on taipumus olla etuoikeutetussa asemassa käsitteiden oppimisessa ja käytössä.

Vaikka semanttiset verkosto- ja prototyyppimallit tuottavatkin mieleenpainuvia deskriptiivisiä teorioita, jotka näyttäisivät tavoittelevan intuitiivisempia luokittelun piirteitä, ne tarjoavat verrattain niukasti kausaalista selitystä siitä, miten tietyt käsitekokonaisuudet järjestäytyvät kognitiivisesti. 1980-luvulla kehitettiin useita uusia teorioita, joissa painotettiin voimakkaammin selitystä (Komatsu 1992). Medin ja Schaffer (1978) esimerkiksi ehdottavat prototyyppiteorian kanssa kilpailevaa esimerkkiin perustuvaa ”kontekstiteoriaa”, jossa vältetään ”perustason” kategorisen tunnistamisen luontainen naturalismi ja annetaan kognitiolle aktiivisempi rooli ”strategioiden ja hypoteesien” laatimisessa, kun muistiin painettuja kategoriaesimerkkejä haetaan. Käsitteiden käytössä toimijat eivät siis ainoastaan navigoi käsitehierarkiassa tai havaitse havaintoperheen samankaltaisuuksia soveltaessaan käsitteitä, vaan he myös muotoilevat aktiivisesti teorioita, jotka on johdettu nykyisestä kontekstista, ja hyödyntävät assosiatiivisia yhteyksiä käsite-ehdokkaiden ja muiden niihin liittyvien käsitteiden välillä. Tässä mallissa käsitteiden käyttö on tieteellistä teoretisointia; myöhemmissä muunnelmissa malli muuttuu ”teoriateoriaksi” (Medin 1989). Erään kannattajan mukaan:

Lapset kehittävät erityisesti abstrakteja, koherentteja kokonaisuuksien ja sääntöjen järjestelmiä, erityisesti kausaalisia kokonaisuuksia ja sääntöjä. Toisin sanoen he kehittävät teorioita. Näiden teorioiden avulla lapset voivat tehdä ennusteita uusista todisteista, tulkita todisteita ja selittää todisteita. Lapset kokeilevat ja tutkivat maailmaa aktiivisesti, testaavat teorian ennusteita ja keräävät asiaankuuluvia todisteita. Jotkin teorian vastaiset todisteet tulkitaan yksinkertaisesti uudelleen teorian kannalta. Lopulta, kun monet teorian ennusteet kuitenkin kumotaan, lapsi alkaa etsiä vaihtoehtoisia teorioita. Jos vaihtoehtoinen teoria ennustaa ja selittää todisteita paremmin, se korvaa olemassa olevan teorian (Gopnik 2003, s. 240).

Empiiriset tutkimukset lasten kognitiivisesta kehityksestä (Gopnik 2003) ja kulttuurienväliset vertailut käsitteellisestä organisaatiosta ja mieltymyksistä (Atran ym. 1999; Medin ym. 2006; Ross ja Medin 2005) ovat osoittaneet vahvaa tukea ”teoriateorian teoriatiedoille”. Quinen näkemys tieteestä ”itsetietoisena maalaisjärjenä” antaa tälle näkemykselle filosofista tukea.

Tässä tutkimuksessa ”teoriateorian” vahvuus on sen suuntautuminen käsitteelliseen holismiin ja skeematismiin – tämän näkemyksen mukaan käsitteet eivät ainoastaan liity maailman objekteihin (vaikkakin varmasti tekevät sitäkin), vaan ne ovat myös dynaamisessa, selittävään laitteistoon kuuluvia käsitteitä ja muita käsitteitä, suhteita ja sääntöjä. Lisäksi toimijat eivät käytä teorioita selittääkseen ilmiöitä itselleen vaan myös muille; käsitteiden käytöllä on siis merkitystä sekä omassa maailman hahmottamisessa että siinä, miten ihminen kuvaa, selittää, perustelee ja kommunikoi muiden kanssa. Lyhyesti sanottuna käsitteitä ei ymmärretä ainoastaan suhteessa maailman objekteihin, kuten korrespondenssiteoria edellyttäisi, vaan ne ovat suhteessa toisiinsa muodostaakseen ainakin paikallisesti johdonmukaisia mentaalisia selityksiä, ja ne myös sitovat osallistuvia käyttäjiä yhteisöiksi ja kulttuureiksi. Tässä esitelty selitys nojautuu vastaavasti täydentäviin koherentistisiin ja konsensukseen perustuviin totuuskäsityksiin selittääkseen kommensuurisuutta.

Kategorisointiteoriat

Vastaa Peruuta vastaus