Tietokonelingvistiikka taikka kieliteknologia on uusi tieteenala, joka tutkii ihmisten kielen käsittelemistä tietokoneella. Se on eräänlaista kielitiedettä, jonka kohteena ovat kielet kuten suomi, englanti tai suahili. Tavoitteena on saada tietokonekin "ymmärtämään" omalla tavallaan kieltä. Kun ymmärtäminen kaiken kaikkiaan on ylivoimainen tehtävä, tietokonelingvistiikka aloittaa tyvestä: ensin tunnistetaan sanoja, niiden taipumisesta huolimatta, sitten pääpiirteittäistä lauserakennetta, jne. Tutkimus on lähellä sitä, mitä yleisessä kielitieteessä tehdään sikäli, että etsitään tapoja kuvata sananmuodostusta ja lauseoppia yksittäisestä kielestä riippumattomilla yleisillä menetelmillä. Toisaalta tietokonelingvistiikka hyödyntää matematiikkaa ja tietojenkäsittelytieteen matemaattisia malleja, josta muodostetaan malleja ja rakennetaan kieliopin formalismeja.
Elämme kuulemma tietoyhteiskunnan kynnyksellä ja aikaa, jolloin tietoa on yhtäkkiä saatavilla lähes rajattomasti. Kieliteknologian haasteita ovatkin tämän tietotulvan hallitseminen löytämällä automaattisempia menetelmiä tietotulvan tekstien "ymmärtämiseen". Toinen tärkeä haaste on kansallisen identiteetin säilyttäminen tukemalla kykyä käsitellä tietokoneilla omia kieliämme siinä missä englantiakin tulevassa tietoyhteiskunnassa.
Viesti koululaisille humanistisiin tieteisiin kuuluvasta tietokonelingvistiikasta onkin se, että kiinnostus kieliin ei nykyään sulje pois matematiikkaa, vaan tulevaisuus avaa tällaisille yhdistelmille aivan erityisiä mahdollisuuksia. Ei ehkä niinkään kaavakirjan sujuvan käytön muodossa, vaan nimenomaan kykynä käsitellä abstrakteja asioita, todistaa ja ymmärtää (eikä vain muistaa ja toistaa). Toivoisinkin, että nykyajan lukiossa riittäisi aikaa johtaa asioita, ymmärtää todistuksia ja syy-seuraussuhteita, koska senlaatuinen tieto ei kerran opittuna häviä. Pitkä matematiikka on perinteisesti ollut tässä suhteessa antoisampi kuin lyhyt.
On tavallista kuulla, että kielioppi olisi tarpeettominta, mitä koulussa opetetaan. Harvoin ajatellaan, kuinka eksyksissä olisimme ympäröivässä luonnossa, ellemme erottaisi kuusta koivusta tai sorsaa varpusesta. Kieli ympäröi meitä hämäävän täydellisesti ja pidämme sitä helposti itsetään selvänä. Osaattehan taivuttaa suomen sanoja: 'koira' - 'koiria', mutta 'kaira' - 'kairoja'. Jopa tuntemattoman tai keksitynkin sanan, kuten 'puta' osaisitte taivuttaa 'putia'. Luultavasti ette kuitenkaan osaa sanoa millä perusteella tämän teette. Kielen rakenteen ja toiminnan kuvaamiseksi on opittava suunnistamaan, opittava tiettyjä maamerkkejä, kielioppi on juuri tätä. Kokeilkaa siis kaksitavuisia a-kirjaimeen loppuvia suomen kielen substantiiveja ja tarkkailkaa vaikka peilin edessä, kun äännätte niiden ensimmäistä vokaalia, niin selitys löytyy. Tarvitsitte kuitenkin tässä aika monta kieliopillista käsitettä.
Kimmo Koskenniemi
professori, tietokonelingvistiikka
Helsingin yliopisto