Friday, November 18, 2016

Tekoäly, Wittgenstein sekä merkityksen yhteisöllisyys, yksilöllisyys ja hahmoluonne

Samasta asiasta käytetään eri nimiä. Samalla sanalla viitataan eri asioihin. Tällaiset ilmiöt ovat kaikille tuttuja oli kyseessä sitten maallikko tai kielen tutkija. Polysemia ja homografia ovat tässä yhteydessä usein käytettyjä kielitieteen termejä. Asiaan liittyy paljon muutakin sisältäen asioita, jotka ovat hyvin tuttuja niin humanisteille kuin silmänsä auki pitäville maallikoillekin. Kielellisiin merkityksiin liittyy seikkoja ja ilmiöitä, joita ei ole helppoa muotoilla filosofisina järjestelminä tai laskennallisina malleina. Seuraavassa näitä asioita tarkastellaan kirjoittajan 80-luvukka alkaneen tutkimustyön kautta.

Ludwig Wittgenstein (1889-1951) on tunnettu filosofi, jonka työ on tapana jakaa kahteen vaiheeseen eli varhaiseen ja myöhäiseen. Löysin Wittgensteinin 1980-luvun loppupuolella kahta reittiä ja kahtena erilaisena versiona. Kielikoneprojektissa olin kieltä tulkitsevaa konetta rakentaessani alkanut tulla lähestulkoon epätoivoiseksi, kun puitteena oli predikaattilogiikka filosofisine lähtökohtineen. Olin kirjoittanut paperille muistiinpanona ajatukseni "sanojen merkitys on niiden käytössä". Tämä oli jotakin muuta kuin mitä logiikkapohjainen merkitysteoria antoi pohjaksi. Niinpä lukiessani Wittgensteinin kirjaa Filosofisia tutkimuksia ja nähdessäni hänen ajatuksensa merkityksestä käyttönä, hauahdin helpotuksesta. En ollutkaan hulluksi tullut nuori tutkija, jonka kriittiset ajatukset soveltamastamme merkitysopista ja sen perustan kuuluisien rakentajien kuten Alfred Tarskin työn perusteista eivät olleetkaan perusteettomia.

Olikin pettymys seuraavaksi lukea varhaista Wittgensteinia. Hänen teoksensa Tractatus Logico-Philosophicus näyttäytyi pikemminkin älykkäältä formaalilta taiteelta kuin työltä, jolla olisi olennaista tekemistä maailman ja merkityksen kanssa. Silloinen ja nykyinen näkemykseni on, että Wittgeinstein harhautuu idealisoimaan maailman, kielen ja niiden välisen suhteen filosofiseksi järjestelmäksi, jossa kielen sanat vastaavat todellisuuden olioita ja kielelliset propositiot (väitelauseet) voidaan assosioida todellisuuden asiantiloihin. Näinhän logiikkapohjaiset merkitysopit rakennetaan, mutta se on aivan liian yksinkertaista. Kieli on monitasoinen dynaaminen järjestelmä, maailma on hyvin kompleksinen ilmiö ja mieli rakentaa paljolti alitajuisesti malliaan kielen ja maailman välisestä suhteesta. Ihmisen kyky hahmottaa maailma erilaisina olioina ja niiden muodostamina luokkina ei ole mitään, jonka voi ottaa filosofisen teorianmuodostuksen pohjana vaan täytyy lähteä siitä, että ihmiselle maailmaa koskevat aistimukset ovat alunperin epämääräisiä hahmoja. Tämän hahmontunnistuksen luonteesta tekoälytutkimuksen osana hahmontunnistustutkimus on antanut paljon ymmärrystä. Kirjoitin aiheesta esimerkiksi otsikolla "Tietokone tallentajasta tulkitsijaksi: Representaatio tietojenkäsittelytieteessä" Tarja Knuuttilan ja Aki Petteri Lehtisen toimittamassa kirjassa Representaatio.

Wittgensteinin filosofisen ajattelun joidenkin puuttellisuuksien kanssa olen siis "taittanut sisäisesti peistä" jo kohta 30 vuotta. Ei ole niin, että ajattelisin Wittgensteinin olleen varsinaisesti väärässä yksityisen kielen argumentissaan, mutta hän tarkastelee asiaa liian kapeasti. Kieli on sekä (1) yhteisöllinen että (2) yksilöllinen ilmiö, joka on sekä (3) representationaalisesti että (4) prosessuaalisesti tilastollisjatkuva-arvoinen. Wittgenstein tarkasteli 1:stä, ohitti 2:n eikä ollut perillä 3:sta ja 4:sta vaan oli jumissa kielessä ja symbolisessa logiikassa.

Kun tarkastellaan suuria tekstiaineistoja, tulee aiempaa yhä selvemmin esille kysymys siitä, kuinka jaettuja kielelliset merkityksen oikeastaan ovat. Wittgenstein esitti perustelut sille, miksi yksityistä kieltä on pidettävä mahdottomana. Wittgensteinin ajattelu jäi kuitenkin puutteelliseksi. Hän painotti liikaa kielen sosiaalista ulottuvuutta eikä ottanut riittävästi huomioon yksilöllistä kognitiivista aspektia. Hänellä ei myöskään ollut käytettävissään filosofiansa perustana matematiikan koko representationaalista arsenaalia. Kielitieteessä ja filosofiassa merkityksiä on tarkasteltu suurelta osin logiikan ja kielen itsensä sisällä. Jos merkityksiä tarkastellaan tilastollisina ja jatkuviin matemattiisiin representaatiohin perustuvina ilmiöinä, voidaan muotoilla "Honkelan yksilöllisten merkitysten argumentti": Jokainen ihminen tulkitsee suuren osan kielellisistä ilmaisuista ainakin jossakin määrin eri tavalla". Tällainen argumentti perustuu mahdollisuuteen mitata merkityksiä matemaattisesti. Keskeinen käsite tällaisen mittaamisen kannalta on konteksti. Kontekstianalyysi tulee sitä tarkemmaksi, mitä enemmän aineistoa on käytettävissä. On toki suureellista puhua "Honkelan argumentista", koska suuri osa humanistisilla tieteenaloilla työtään tekivistä ihmisistä tuntuu ja ymmärtää tämän ilmiön oikein hyvin. Ilmiön formalisointi ei kuitenkaan ole lainkaan triviaalista ja käsittäkseni sitä ei ole juurikaan tehty. Varhaisia töitä, joissa olen itse tarkastellut asiaa ovat esimerkiksi "Neural nets that discuss: a general model of communication based on self-organizing maps" (ICANN'93) ja väitöskirjani vuonna 1997. Tutkimus on jatkunut erilaisissa puitteissa, erityisesti Grounded Intersubjective Concept Analysis -menetelmän kehittämiseen liittyen. Aiheeseen liittyviä julkaisuja on listattu tämän tiedoston liitteeksi.

Usein käytän esimerkkinä värisanoja merkitystä koskevissa keskusteluissa (Wittgensteinin tapaan). Väri voidaan esittää kätevästi kolmella numerolla. Mikä on sanan "musta" merkitys? Prototyyppinen merkitys on itsestäänselvä. Assosiaation prototyyppisestä havaitusta mustasta sanaan musta (svart, black, noir, ...) on selkeä eikä sisällä subjektiivista variaatiota kuin äärimmäisissä poikkeustapauksissa. Tilanne muuttuu mielenkiintoiseksi toiseen suuntaan kuljettaessa. Mitä ovat ne havaitut värit, joita kukin meistä kutsuu mustaksi (ja missä konteksteissa, mikä tekee ilmiöstä kuultavasti äärettömömän kompleksisen jo tämän yhden esimerkin kautta). Konvergenssi tässä mustaesimerkissä tarkoitta sitä, että kaksi ihmistä käyttää sanaa musta niin, että yksi oppii tietämään, minkälaisessa tilanteessa (minkälaisesta väristä, minkälaisessa kontekstissa) toinen käyttää sanaa musta. Ihmiset, jotka ovat riittävästi tekemisessä keskenään, voivat mallintaa pareittain (tai ryhminä) spesifenä kielen käyttötapoja. Eristettyyn laaksoon joutuneet ihmiset alkavat kehittää omanlaistaan kieltä. Sanoja keksitään, koska ei tiedetä, mitä sanaa ja millä merkityksellä vanhassa kielessä operoitiin. Tunnetut sanat rapautuvat merkitykseltään, koska muisti ei ole ehtymätön varasto, johon kaikki mahdolliset merkitystulkinnat voisi tallentaa. Koska monet merkitykset kuten väri-ilmiö ovat jatkuva-arvoisia, divergenssi on väistämätöntä. Monien kielipelien kannalta "desimaalien osien" erot merkityksissä eivät onneksi estä vuorovaikutusta onnistumasta. Olen kuitenkin ollut tilanteissa, joissa esimerkiksi joku sanoo ulkotakista, että se on musta ja toinen tummansininen. Värit ovat yksinkertainen ilmiö, vaikka niistäkin on kirjoitettu monen monta kirjaa. Miten pärjäämme sanojen kanssa, joiden merkityksellä ei ole mitään vakaata perustaa? Olisi hienoa päästä tekemään merkitysten syväanalyysia esimerkiksi USAn vaaleissa eri tavalla äänestäneille.

Kansainvälisestikään tällä alueella (merkitysten tulkinnan yksilöllisyyden mallintaminen) toimivia tutkijoita ei näyttäisi olevan monia. Piristävä poikkeus on Luc Steels, joka on rakantanut ryhmineen esimerkiksi robottikameroihin perustuvia järjestelmiä, jotka oppivat keskustelemaan mielekkäästi, vaikka niillä on erilaiset näkökulmat nimeämisen kohteisiin.

Helsinki, 18.11.2016, Timo Honkela

Kiitän 10.11.2016 asiaa koskevaan Facebook-keskusteluun osallistuneita mahdollisuudesta saada keskustella aiheesta näkemystä syventäen: Oskar Kohonen, Ossi Kuittinen, Anna-Mari Rusanen, Klaus Tuurala, Tero Valkonen ja Matti J. Yrjänä.

Aiheeseen liittyviä julkaisujani yhteistyökumppaneiden kanssa:

  • Timo Honkela. Neural nets that discuss: a general model of communication based on self-organizing maps. In S. Gielen and B. Kappen, editors, Proceedings of ICANN'93, International Conference on Artificial Neural Networks, pages 408-411, Amsterdam, the Netherlands, September 1993. Springer-Verlag, London.
  • Timo Honkela. Self-Organizing Maps in Natural Language Processing. PhD thesis, Helsinki University of Technology, Espoo, Finland, 1997.
  • Juha Raitio, Ricardo Vigário, Jaakko Särelä, and Timo Honkela. Assessing similarity of emergent representations based on unsupervised learning. In Proceedings of IJCNN 2004, pages 597-602, Budapest, Hungary, 2004.
  • Tiina Lindh-Knuutila, Timo Honkela, and Krista Lagus. Simulating meaning negotiation using observational language games. In P. Vogt et al., editor, Symbol Grounding and Beyond: Proceedings of the Third International Workshop on the Emergence and Evolution of Linguistic Communication, pages 168-179, Rome, Italy, 2006. Springer, Berlin/Heidelberg.
  • Timo Honkela. Philosophical aspects of neural, probabilistic and fuzzy modeling of language use and translation. In Proceedings of IJCNN, pages 2881-2886, 2007.
  • Timo Honkela, Ville Könönen, Tiina Lindh-Knuutila, and Mari-Sanna Paukkeri. Simulating processes of concept formation and communication. Journal of Economic Methodology, 15(3):245-259, 2008.
  • Timo Honkela, Nina Janasik, Krista Lagus, Tiina Lindh-Knuutila, Mika Pantzar, and Juha Raitio. Modeling communities of experts - conceptual grounding of expertise. Technical Report TKK-ICS-R24, Helsinki University of Technology, 2009.
  • Mari-Sanna Paukkeri, Marja Ollikainen, and Timo Honkela. Assessing user-specific difficulty of documents. Information Processing & Management. Hybrid bilinear and trilinear models for exploratory analysis of three-way poisson counts
  • Juha Raitio, Tapani Raiko, and Timo Honkela. International Conference on Artificial Neural Networks, 475-482, 2012.
  • Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar. Subjects on objects in contexts: using GICA method to quantify epistemological subjectivity IJCNN 2012, 1-9, 2012.

No comments:

Post a Comment