Friday, November 18, 2016

Tekoäly, Wittgenstein sekä merkityksen yhteisöllisyys, yksilöllisyys ja hahmoluonne

Samasta asiasta käytetään eri nimiä. Samalla sanalla viitataan eri asioihin. Tällaiset ilmiöt ovat kaikille tuttuja oli kyseessä sitten maallikko tai kielen tutkija. Polysemia ja homografia ovat tässä yhteydessä usein käytettyjä kielitieteen termejä. Asiaan liittyy paljon muutakin sisältäen asioita, jotka ovat hyvin tuttuja niin humanisteille kuin silmänsä auki pitäville maallikoillekin. Kielellisiin merkityksiin liittyy seikkoja ja ilmiöitä, joita ei ole helppoa muotoilla filosofisina järjestelminä tai laskennallisina malleina. Seuraavassa näitä asioita tarkastellaan kirjoittajan 80-luvukka alkaneen tutkimustyön kautta.

Ludwig Wittgenstein (1889-1951) on tunnettu filosofi, jonka työ on tapana jakaa kahteen vaiheeseen eli varhaiseen ja myöhäiseen. Löysin Wittgensteinin 1980-luvun loppupuolella kahta reittiä ja kahtena erilaisena versiona. Kielikoneprojektissa olin kieltä tulkitsevaa konetta rakentaessani alkanut tulla lähestulkoon epätoivoiseksi, kun puitteena oli predikaattilogiikka filosofisine lähtökohtineen. Olin kirjoittanut paperille muistiinpanona ajatukseni "sanojen merkitys on niiden käytössä". Tämä oli jotakin muuta kuin mitä logiikkapohjainen merkitysteoria antoi pohjaksi. Niinpä lukiessani Wittgensteinin kirjaa Filosofisia tutkimuksia ja nähdessäni hänen ajatuksensa merkityksestä käyttönä, hauahdin helpotuksesta. En ollutkaan hulluksi tullut nuori tutkija, jonka kriittiset ajatukset soveltamastamme merkitysopista ja sen perustan kuuluisien rakentajien kuten Alfred Tarskin työn perusteista eivät olleetkaan perusteettomia.

Olikin pettymys seuraavaksi lukea varhaista Wittgensteinia. Hänen teoksensa Tractatus Logico-Philosophicus näyttäytyi pikemminkin älykkäältä formaalilta taiteelta kuin työltä, jolla olisi olennaista tekemistä maailman ja merkityksen kanssa. Silloinen ja nykyinen näkemykseni on, että Wittgeinstein harhautuu idealisoimaan maailman, kielen ja niiden välisen suhteen filosofiseksi järjestelmäksi, jossa kielen sanat vastaavat todellisuuden olioita ja kielelliset propositiot (väitelauseet) voidaan assosioida todellisuuden asiantiloihin. Näinhän logiikkapohjaiset merkitysopit rakennetaan, mutta se on aivan liian yksinkertaista. Kieli on monitasoinen dynaaminen järjestelmä, maailma on hyvin kompleksinen ilmiö ja mieli rakentaa paljolti alitajuisesti malliaan kielen ja maailman välisestä suhteesta. Ihmisen kyky hahmottaa maailma erilaisina olioina ja niiden muodostamina luokkina ei ole mitään, jonka voi ottaa filosofisen teorianmuodostuksen pohjana vaan täytyy lähteä siitä, että ihmiselle maailmaa koskevat aistimukset ovat alunperin epämääräisiä hahmoja. Tämän hahmontunnistuksen luonteesta tekoälytutkimuksen osana hahmontunnistustutkimus on antanut paljon ymmärrystä. Kirjoitin aiheesta esimerkiksi otsikolla "Tietokone tallentajasta tulkitsijaksi: Representaatio tietojenkäsittelytieteessä" Tarja Knuuttilan ja Aki Petteri Lehtisen toimittamassa kirjassa Representaatio.

Wittgensteinin filosofisen ajattelun joidenkin puuttellisuuksien kanssa olen siis "taittanut sisäisesti peistä" jo kohta 30 vuotta. Ei ole niin, että ajattelisin Wittgensteinin olleen varsinaisesti väärässä yksityisen kielen argumentissaan, mutta hän tarkastelee asiaa liian kapeasti. Kieli on sekä (1) yhteisöllinen että (2) yksilöllinen ilmiö, joka on sekä (3) representationaalisesti että (4) prosessuaalisesti tilastollisjatkuva-arvoinen. Wittgenstein tarkasteli 1:stä, ohitti 2:n eikä ollut perillä 3:sta ja 4:sta vaan oli jumissa kielessä ja symbolisessa logiikassa.

Kun tarkastellaan suuria tekstiaineistoja, tulee aiempaa yhä selvemmin esille kysymys siitä, kuinka jaettuja kielelliset merkityksen oikeastaan ovat. Wittgenstein esitti perustelut sille, miksi yksityistä kieltä on pidettävä mahdottomana. Wittgensteinin ajattelu jäi kuitenkin puutteelliseksi. Hän painotti liikaa kielen sosiaalista ulottuvuutta eikä ottanut riittävästi huomioon yksilöllistä kognitiivista aspektia. Hänellä ei myöskään ollut käytettävissään filosofiansa perustana matematiikan koko representationaalista arsenaalia. Kielitieteessä ja filosofiassa merkityksiä on tarkasteltu suurelta osin logiikan ja kielen itsensä sisällä. Jos merkityksiä tarkastellaan tilastollisina ja jatkuviin matemattiisiin representaatiohin perustuvina ilmiöinä, voidaan muotoilla "Honkelan yksilöllisten merkitysten argumentti": Jokainen ihminen tulkitsee suuren osan kielellisistä ilmaisuista ainakin jossakin määrin eri tavalla". Tällainen argumentti perustuu mahdollisuuteen mitata merkityksiä matemaattisesti. Keskeinen käsite tällaisen mittaamisen kannalta on konteksti. Kontekstianalyysi tulee sitä tarkemmaksi, mitä enemmän aineistoa on käytettävissä. On toki suureellista puhua "Honkelan argumentista", koska suuri osa humanistisilla tieteenaloilla työtään tekivistä ihmisistä tuntuu ja ymmärtää tämän ilmiön oikein hyvin. Ilmiön formalisointi ei kuitenkaan ole lainkaan triviaalista ja käsittäkseni sitä ei ole juurikaan tehty. Varhaisia töitä, joissa olen itse tarkastellut asiaa ovat esimerkiksi "Neural nets that discuss: a general model of communication based on self-organizing maps" (ICANN'93) ja väitöskirjani vuonna 1997. Tutkimus on jatkunut erilaisissa puitteissa, erityisesti Grounded Intersubjective Concept Analysis -menetelmän kehittämiseen liittyen. Aiheeseen liittyviä julkaisuja on listattu tämän tiedoston liitteeksi.

Usein käytän esimerkkinä värisanoja merkitystä koskevissa keskusteluissa (Wittgensteinin tapaan). Väri voidaan esittää kätevästi kolmella numerolla. Mikä on sanan "musta" merkitys? Prototyyppinen merkitys on itsestäänselvä. Assosiaation prototyyppisestä havaitusta mustasta sanaan musta (svart, black, noir, ...) on selkeä eikä sisällä subjektiivista variaatiota kuin äärimmäisissä poikkeustapauksissa. Tilanne muuttuu mielenkiintoiseksi toiseen suuntaan kuljettaessa. Mitä ovat ne havaitut värit, joita kukin meistä kutsuu mustaksi (ja missä konteksteissa, mikä tekee ilmiöstä kuultavasti äärettömömän kompleksisen jo tämän yhden esimerkin kautta). Konvergenssi tässä mustaesimerkissä tarkoitta sitä, että kaksi ihmistä käyttää sanaa musta niin, että yksi oppii tietämään, minkälaisessa tilanteessa (minkälaisesta väristä, minkälaisessa kontekstissa) toinen käyttää sanaa musta. Ihmiset, jotka ovat riittävästi tekemisessä keskenään, voivat mallintaa pareittain (tai ryhminä) spesifenä kielen käyttötapoja. Eristettyyn laaksoon joutuneet ihmiset alkavat kehittää omanlaistaan kieltä. Sanoja keksitään, koska ei tiedetä, mitä sanaa ja millä merkityksellä vanhassa kielessä operoitiin. Tunnetut sanat rapautuvat merkitykseltään, koska muisti ei ole ehtymätön varasto, johon kaikki mahdolliset merkitystulkinnat voisi tallentaa. Koska monet merkitykset kuten väri-ilmiö ovat jatkuva-arvoisia, divergenssi on väistämätöntä. Monien kielipelien kannalta "desimaalien osien" erot merkityksissä eivät onneksi estä vuorovaikutusta onnistumasta. Olen kuitenkin ollut tilanteissa, joissa esimerkiksi joku sanoo ulkotakista, että se on musta ja toinen tummansininen. Värit ovat yksinkertainen ilmiö, vaikka niistäkin on kirjoitettu monen monta kirjaa. Miten pärjäämme sanojen kanssa, joiden merkityksellä ei ole mitään vakaata perustaa? Olisi hienoa päästä tekemään merkitysten syväanalyysia esimerkiksi USAn vaaleissa eri tavalla äänestäneille.

Kansainvälisestikään tällä alueella (merkitysten tulkinnan yksilöllisyyden mallintaminen) toimivia tutkijoita ei näyttäisi olevan monia. Piristävä poikkeus on Luc Steels, joka on rakantanut ryhmineen esimerkiksi robottikameroihin perustuvia järjestelmiä, jotka oppivat keskustelemaan mielekkäästi, vaikka niillä on erilaiset näkökulmat nimeämisen kohteisiin.

Helsinki, 18.11.2016, Timo Honkela

Kiitän 10.11.2016 asiaa koskevaan Facebook-keskusteluun osallistuneita mahdollisuudesta saada keskustella aiheesta näkemystä syventäen: Oskar Kohonen, Ossi Kuittinen, Anna-Mari Rusanen, Klaus Tuurala, Tero Valkonen ja Matti J. Yrjänä.

Aiheeseen liittyviä julkaisujani yhteistyökumppaneiden kanssa:

  • Timo Honkela. Neural nets that discuss: a general model of communication based on self-organizing maps. In S. Gielen and B. Kappen, editors, Proceedings of ICANN'93, International Conference on Artificial Neural Networks, pages 408-411, Amsterdam, the Netherlands, September 1993. Springer-Verlag, London.
  • Timo Honkela. Self-Organizing Maps in Natural Language Processing. PhD thesis, Helsinki University of Technology, Espoo, Finland, 1997.
  • Juha Raitio, Ricardo Vigário, Jaakko Särelä, and Timo Honkela. Assessing similarity of emergent representations based on unsupervised learning. In Proceedings of IJCNN 2004, pages 597-602, Budapest, Hungary, 2004.
  • Tiina Lindh-Knuutila, Timo Honkela, and Krista Lagus. Simulating meaning negotiation using observational language games. In P. Vogt et al., editor, Symbol Grounding and Beyond: Proceedings of the Third International Workshop on the Emergence and Evolution of Linguistic Communication, pages 168-179, Rome, Italy, 2006. Springer, Berlin/Heidelberg.
  • Timo Honkela. Philosophical aspects of neural, probabilistic and fuzzy modeling of language use and translation. In Proceedings of IJCNN, pages 2881-2886, 2007.
  • Timo Honkela, Ville Könönen, Tiina Lindh-Knuutila, and Mari-Sanna Paukkeri. Simulating processes of concept formation and communication. Journal of Economic Methodology, 15(3):245-259, 2008.
  • Timo Honkela, Nina Janasik, Krista Lagus, Tiina Lindh-Knuutila, Mika Pantzar, and Juha Raitio. Modeling communities of experts - conceptual grounding of expertise. Technical Report TKK-ICS-R24, Helsinki University of Technology, 2009.
  • Mari-Sanna Paukkeri, Marja Ollikainen, and Timo Honkela. Assessing user-specific difficulty of documents. Information Processing & Management. Hybrid bilinear and trilinear models for exploratory analysis of three-way poisson counts
  • Juha Raitio, Tapani Raiko, and Timo Honkela. International Conference on Artificial Neural Networks, 475-482, 2012.
  • Timo Honkela, Juha Raitio, Krista Lagus, Ilari T. Nieminen, Nina Honkela, and Mika Pantzar. Subjects on objects in contexts: using GICA method to quantify epistemological subjectivity IJCNN 2012, 1-9, 2012.

Wednesday, November 16, 2016

Tekoälyn ensyklopedia -kirjan esittely vuonna 1993

Vuonna 1993 Eero Hyvönen, Ilkka Karanta ja Markku Syrjänen toimittivat Suomen tekoälytutkimuksen merkkiteoksen nimeltään "Tekoälyn ensyklopedia". Suomessa oli päädytty tutkimaan ja kehittämään tekoälyä saman otsikon alla riippumatta paradigmasta ja menetelmästä. Tekoälyseura toimi aktiivisesti sekä sääntöpohjaisten järjestelmien että neuroverkkojen kehittäjien puolestapuhujana. Konferenssijulkaisuissa eri paradigmojen edustajat olivat tervetulleita. Tekoälyseurassa haluttiin pitään yllä aktiivista yhteyttä myös lähitieteisiin. Esimerkiksi kognitiotiedettä haluttiin pitää seuran erityisessä suojeluksessa, koska kognitiotieteellä ei ollut omaa tieteellistä seuraansa. Mukana kirjan kirjoittajina olivat esimerkiksi kielitieteilijät Fred Karlsson ja Lauri Carlson, psykologi Kirsti Lonka, filosofi Antti Hautamäki ja matemaatikko Lasse Holmström. Lonka kunnostautui kognitiotieteen verkostojen rakentajana.

Syystä, jota en tarkkaan enää muista, mutta ehkä johtuen siitä, että olin mukana kolmen eri luvun kirjoittajana (Lauri Carlson: Luonnollisen kielen käsittely; Timo Honkela ja Tuomas Sandholm: Koneoppiminen; Aarno Lehtola ja Timo Honkela: Haku ja pelit), sain olla aktiivisesti esittelemässä kirjaa, kun se julkistettiin 24.4.1993. Esitelmäkalvot antavat varsin kattavan kuvan kirjassa käsitellyistä aiheista ja siitä, mitä siihen aikaan pidettiin keskeisinä näkökulmina. Tietysti itse kirjaa täytyy pitää tärkeämpänä lähteenä kuin näitä kalvoja, koska kunkin kirjoittajan näkökulma on huomattavasti tarkemmin esillä.

Kirjaesittelyn kalvot

Hyvä esimerkki moniparadigmaisuudesta on kalvo, jossa viitataan Eero Hyvösen, Vesa A. Niskasen sekä Lasse Holmströmin ja Teuvo Kohosen kirjoituksiin. Hyvönen on sittemmin rakentanut kansainvälisestikin tarkasteltuna erityisen laajaa semanttisen laskennan infrastruktuuria. Niskanen on edistänyt aktiivisesti sumean logiikan ja joukko-opin tutkimusta ja soveltamista muun muassa rakentamalla aktiivisen yhteistyön maailmankuulun professorin Lotfi Zadehin kanssa. Kohonen on luku erikseen nykyisenä akateemikkona ja Suomen siteeratuimpana tieteentekijänä adaptiivisten malliensa, erityisesti itseorganisoivan kartan (Self-Organizing Map, SOM) ansiosta. Hyvönen valittiin vuonna 2016 merkittävän digitaalisia ihmistieteitä koordinoivan HELDIG-keskuksen johtajaksi. Tässä tehtävässä hän tekee läheistä yhteistyötä esimerkiksi historioitsija Mikko Tolosen kanssa.

Vuonna 1995 sain mahdollisuuden siirtyä Kohosen laboratorioon työskenneltyäni sitä ennen VTT:llä noin viisi vuotta tietämystekniikan, kieliteknologian ja neuroverkkojen parissa. Tuohon aikaan itseorganisoivia karttoja ei ollut tarjolla avoimen lähdekoodin ohjelmatotutuksina ja niinpä vuonna 1990 opiskelinkin C-ohjelmointikielen (Lisp-kielen käyttämisen jälkeen) ja toteutin SOM-algoritmin vuosien 1991 ja 1993 julkaisujani varten.

Helsinki, 16.11.2016, Timo Honkela

Yksinäistä auttava kone?

Voisiko kone auttaa ihmisiä yksinäisyydessä? Professori Juho Saari toimitti kirjan Yksinäisten Suomi. Olin mukana pienellä osuudella Krista Laguksen ehdotuksesta kirjoittamassa kirjan lukua "Yksinäisyys mielen rakenteissa" hänen kanssaan.

Olen tehnyt tekoälyä, luonnollisen kielen käsittelyä ja koneoppimista koskevaa tutkimusta hieman yli 30 vuoden ajan. Näkökulma on vuosien mittaan kehittynyt voisiko sanoa strategiseen suuntaan. Mihin suuntaan tällaisia välineitä on syytä kehittää, jotta niistä olisi erityisesti hyötyä ihmisten kannalta? Pitkään kehityksen kohteina ovat olleet esimerkiksi tiedonhaku ja konekääntäminen. Sitran rahoittamassa Kielikoneprojektissa, jossa aloitin tutkijan urani 1980-luvulla, tavoitteena oli kehittää järjestelmä, joka osaisi vastata ihmisen kirjoittamiin kysymyksiin ja komentoihin. Kohteena oli tuolloin suomalaisia pörssiyrityksiä koskeva tietokanta. Haluttiin, että järjestelmä antaisi vastauksen vaikkapa kyselyyn "Anna kymmenen suurimman metsäteollisuusyrityksen liikevaihto ja käyttökate". Tekoälyä kehitettiin tuolloin kirjaamalla kielen (sanojen ja lauseiden) rakenteita koskevia sääntöjä ja sääntöjä, joiden avulla kone pääsisi etenemään lauserakenteista loogisiin merkitysesityksiin ja edelleen SQL-tietokantakyselyihin. Tuolloin 1980-luvun loppupuolella nämä kokemukset paljastivat itselleni selvästi, että kielellisten merkitysten mallintamiseen pelkkä symbolinen logiikka käsinkirjattuihin sääntöihin perustuen on liian kepoinen keino (siitä, miksi näin on, olen kirjoittanut monella foorumilla). Niinpä suuntauduin neuroverkkojen ja koneoppisen pariin.

Voisivatko koneet ja tekoäly auttaa ihmisiä yksinäisyydessä? Apple Sirin vastaus ääneen lausuttuun valitukseen "tunnen itseni yksinäiseksi" on väkisinki pinnallinen. Ehkei ole täysin vailla lohtuvaikutusta kuulla koneen sanovan: "Voit aina puhua minulle", mutta on silti ongelmallista, että lausuja on ohjelmoitu kone eikä aidosti empaattinen tunteva ihminen. Voiko koneella olla mitään roolia? Kone ei ole ihminen. Tuo 1980-luvun Kielikoneprojektissa sovellettu tekoälytekniikka oli samaa kuin mitä Applen systeemi hyödyntää nykyään. Moni kokeili ja jotkut ohjelmoivat itsekin avainsanoihin reagoivia järjestelmiä. Tällaine ohjelma nimittiin esimerkiksi Kalle kotipsykologiksi. Jos sille kirjoitti vaikkapa "Isä polttaa liikaa tupakkaa" tai "Äiti on poissaolevan tuntuinen", ohjelma tunnisti sanan "isä" tai "äiti" ja vastasi, "Kerro lisää perheestäsi". Tällainen keskustelu mukaan lukien Applen Sirin tuottama on inhimillisen keskustelun irvikuva. Mikä on tekoälytutkijan ehdotus tällaiseen tilanteeseen? Lähden siitä, että ei pidä ajatella koneen olevan ihminen, eikä varsinkaan korvaavan ihmistä tuntevana olentona. Kyse on pikemminkin siitä, että tekoälyä ja koneoppimista voidaan hyödyntää monimutkaisten ja kontekstiherkkien ilmiöiden mallintamisessa. On ainakin kaksi kehityspolkua, joita kuvaan seuraavaksi.

Ihmisiä neuvovat koneet. Psykososiaalisista ilmiöistä saadaan koko ajan lisää tietoa tavalla, jota voidaan myös kirjata koneelliseen muotoon. Tämä tieto ja ymmärrys on yleensä syvällisemmässä muodossa psykologeilla, jotka ovat saaneet alan koulutuksen ja keränneet kokemusten käydessään läpi ihmiskohtaloita. Psykologian olennainen piirre on yksilöllisyys ja konteksuaalisuus. Niinpä luonnontieteilijän tieteelliset ihanteet ovat riittämämiä ja pahimmillaan jopa mukatieteellisen naiiveja ilmiöiden luonteen näkökulmasta. Läheskään jokaiseen tilanteeseen, jossa ymmärrystä, reflekioita, tulkintoja ja neuvoja tarvittaisiin, ei riitä ammattitaitoisia ihmisiä. Ei voida rakentaa perinteistä tekoälyjärjestelmää tai lääketieteen kaltaista diagnoosi ja hoitosuositusjärjestelmää, koska jokainen tilanne täytyy selvittää erikseen. Tässä apuun voi tulla tilastollinen koneoppiminen. Se, mikä on lääketieteessä kehittymässä oleva haave eli yksilöllinen hoito, on psykologiassa välttämättömyys. Koneoppiminen antaa mahdollisuuden rakentaa rikas malli ilmiöstä niin, että kone voi antaa apua tilanteiden ja ongelmien tulkitsemiseksi, apukeinojen löytämiseksi ja sopivien inhimillisten resurssien löytymiseksi. Lause "You can always talk to me" voi olla askel kohti jotakin hyödyllistä, jos taustalla on parhaimmillaan miljoonien ihmisten kokemuksiin perustuva malli ihmisenä olemisen perusteista. Ongelmatilanteiden kuvauksia on valtava määrä jo nykyään sosiaalisessa mediassa. Kontekstirelevanttien tulkintojen, käsitteiden ja ratkaisuehdotusten kokoaminen ei ole yhtä helppoa.

Ihmisiä toistensa luo tuovat koneet. Neuvovien koneiden osajoukkona voidaan pitää järjestelmiä, jotka rakentavat ihmisten välisiä yhteyksiä. Voidaan kehittää järjestelmä, joka etsii yksinäiselle tai muuten ongelmallisessa tilanteessa oleville ihmisille keskustelukumppanin. Nykyään on jo helppoa etsiä seuraa perustuen avainsanoihin ja määriteltyihin kategorioihin, mutta näiden avulla ei helposti päästä käsiksi asioihin, jotka voivat olla vuorovaikutuksen kannalta ratkaisevia. Luonnollisen kielen käsittelyssä on vasta viime aikoina alettu päästä käsiksi "rivien väliin". On esimerkiksi pystyttävä rakentamaan järjestelmiä, jotka erottavat toisistaan tosissaan olevat ihmiset huijaajista ja valehtelijoista. Yksinäisen ihmisen yksinäisyyden syynä voi olla lapsuuden traumaattinen kokemus. Tällaisen ihmisen kannalta luottamus on erityisen tärkeää. Voi kuulostaa idealistiselta, mutta on hyvinkin mahdollista, että kone voi auttaa traumatisoitunutta ihmistä löytämään tavan luottaa toisiin ihmisiin.

Kuvatun kaltaisten skenaarioiden toteutuminen vaatii määrätietoista työtä. Mitään täysin periaatteellista estettä tällaisen kehityspolun edessä en näe. Digitaaliset ihmistieteet tuovat avuksemme ja iloksemme aivan uudenlaista "kirjapainotaitoa". Kirjat eivät ole enää passiivisia lukemisen kohteita vaan aktiivisia tulkinnassa auttavia episteemisia objekteja eli sisältöjen tiedollisista ja tunteellisista ulottuvuuksista perillä olevia artefaktoja. Tällaisten välineiden hyvä hyödyntäminen vaatii nykyistäkin tiedostavampaa medialukutaitoa ja lähdekriittisyyttä. Tässä on yksi mukava haaste tulevaisuuden kouluille.

Espoossa, 16.11.2016, Timo Honkela