Henrik Ingo
Muistan erään keskustelun vaimoni kanssa, jota en muista.
Tarkoitan, että muistan erään mielenkiintoisen keskustelun viime syksyltä, vaikka en muistakaan keskustelun sisältöä. Mielenkiintoista olikin se, mitä keskustelussa tapahtui. Se oli lyhyt ja koski jotain arkipäiväistä asiaa, kuten että meille oli tulossa seuraavana päivänä vieraita tai olimme menossa jonnekin. Olin pohtinut tätä arkipäiväistä asiaa, kun sanoin vaimolleni:
Mielestäni meidän pitäisi tehdä tämän asian suhteen X.
Jostain syystä vaimoni kuitenkin ymmärsi minut väärin ja luonnollisesti ehdotukseni kuulostikin hänestä varmaan kovin älyttömältä. Joten hän ehdotti:
Eikö olisi parempi tehdä Y.
Koska hän ei ollut alun perinkään ymmärtänyt mitä olin sanomassa, ei hänen parannusehdotuksensakaan tietenkään voinut olla kovin hyvä. Kuitenkin muistan, että seuraavalla repliikillä yllätin itseni:
Ei ei, nyt et tainnut aivan ymmärtää mitä tarkoitin. Tarkoitin että... Mutta nyt kun sanoit noin (Y), niin itse asiassa meidän kannattaakin ... (Z).
Keskustelu jäi mieleeni kahdesta syystä, lähinnä jälkimmäisestä. Ensinnäkin keskustelu oli sisällöltään aika lohdutonta kuultavaa. Jos kolmeen repliikkiin saa mahdutettua kaksi väärinymmärrystä, niin jäljelle ei voi jäädä kovin paljon tilaa asialle. Eikä jäänytkään, keskustelu oli sisällöltään täysin älytön, jos ajatellaan miltä se olisi mahtanut kuulostaa jollekin ulkopuoliselle.
Kuitenkin keskustelun lopputuloksena oli päässäni syntynyt idea (Z), joka oli huomattavasti parempi kuin se mitä aluksi esitin (X). Näennäisesti vaimoni esittämä ratkaisu (Y) ei liittynyt tähän mitenkään. Sillä ei sisällöltään ollut mitään yhteistä lopullisen ratkaisun (Z) kanssa ja muutenkin se oli väärinymmärryksistämme johtuen ratkaisu johonkin aivan muuhun ongelmaan kuin mitä itse pohdin. Kuitenkin jos tätä keskustelua ei olisi ollut, olisin ollut tyytyväinen alkuperäiseen ratkaisuuni (X), joka oli selvästi huonompi kuin lopullinen ratkaisu (Z).
Eli lyhyesti sanottuna: Keskustelu joka ei sisältänyt mitään "järkevää", johti parempaan ideaan Z, jota ei kuitenkaan olisi syntynyt ilman tuota keskustelua.
Neuraalilaskenta on tieteenala, joka joskus rinnastetaan tekoälyyn ja sumeaan logiikkaan, mutta tosiasiassa nämä kaksi jälkimmäistä sisältävät paljon muutakin kuin neuraalilaskentaa. Neuraalilaskennan perusajatus on ollut aivotutkimuksen soveltaminen ohjelmointiin, eli tehdä tietokone joka toimii samoilla periaatteilla kuin ihmisaivot. Perinteisestihän tietokone toimii juuri päinvastoin kuin aivot, eli on nopea laskemaan, hyvä muistamaan suuria tietomääriä ja tyhmä kuin pässi. Ihminen taas on älykäs (mitä ikinä se sitten tarkoittaakaan), huono laskemaan pitemmälle kuin kymmeneen ja huonomuistinen.
Tämän perusajatuksen lisäksi neuraalilaskenta on ruokkinut itseään tilastotieteestä ja signaalinkäsittelystä, Tosin varsinkin jälkimmäinen voidaan lokeroida osaksi perusajatusta, sillä ihmisaivojakin voidaan tarkastella signaalinkäsittelylaitteena.
Neuroverkoksi kutsutaan sellaista matemaattista oliota, joka koostuu “neuroneista” ja niiden välisistä “synapseista”, biologisten esikuviensa mukaan. Käytännössä neuroni on jokin yksinkertainen matemaattinen funktio (aktivaatiofunktio) ja synapsi on kerroin tai painokerroin eli suomeksi sanottuna joku numero.
(Aktivaatiofunktio voi olla esimerkiksi f(x) = 1/(1+exp(-x)) tai askelfunktio. Yleensä halutaan, että se on vähintään epälineaarinen, sillä muuten verkko typistyy pelkäksi matriisilaskuksi. Lisäksi se on yleensä derivoituva, sillä verkon opettaminen on yleensä gradienttioptimointia. Ja lopuksi funktio on yleensä rajattu jollekin välille, kuten edellä f(x) = [0..1].)
Neuroverkkoja voidaan tehdä hyvinkin monimutkaisia, sellaisia joissa synapsit menevät ristiin, muodostavat silmukoita (takaisinkytkentä) ja sisältävät aikaviiveitä, mutta yksinkertainen esimerkki neuroverkosta on Multi Layer Perceptron, jossa neuronit on järjestetty nätisti kerroksiin ja laskenta etenee vasemmalta oikealle.
MLP-verkkoon annetaan syötteeksi joku numerosarja (vektori). Kukin syöte on kytketty seuraavan kerroksen jokaiseen neuroniin synapsilla, eli painokertoimella.
Tarkastellaan mitä tapahtuu yksittäisessä piilokerroksen neuronissa. Neuroniin tulee yhtä monta “signaalia”, eli numeroa, kuin edellisessä kerroksessa on neuroneja. Kukin numero kerrotaan omalla painokertoimellaan ja tämän jälkeen ne kaikki summataan yhteen. Eli lopputuloksena saadaan yksi numero joka on tulos kaikista syötteistä kerrottuna painokertoimillaan.
Tämä numero taas työnnetään aktivaatiofunktion läpi, jolloin se muuttuu joksikin muuksi numeroksi, joka onkin neuronin tulos (output)! Koska kyseessä oli MLP-verkko, tämä tulos muuttuukin nyt seuraavan neuronikerroksen syötteeksi eli se lähetetään synapseja pitkin taas kuhunkin siellä olevaan neuroniin.
Kun kerroksia ei ole enää jäljellä, neuronin tulos on verkon tulos. Ulostuloneuroneja voi olla yksi tai useampia, ja muutenkin jokaisessa kerroksessa voi olla eri määrä neuroneja.
Eli itse asiassa neuroverkko on matemaattinen möhkäle, jossa vuoroin tehdään kertolaskuja ja yhteenlaskuja ja “joku monimutkaisempi operaatio”, jota nimitetään aktivaatiofunktioksi. Möhkäleen hahmottaminen neuroneista ja painokertoimista koostuvana verkkona kuitenkin tekee rakenteesta yksinkertaisen.
Muuttamalla verkon painoja, voidaan vaikuttaa lopputulokseen eli säätää neuroverkon käyttäytymistä. Tätä kutsutaan verkon opettamiseksi.
Käydäänpä sama asia läpi vielä esimerkin avulla. MLP-verkkoa voidaan esimerkiksi hyvin soveltaa käsinkirjoitettujen merkkien tunnistamiseen.
Kirjoitetaan lyijykynällä numeroita valkoiselle paperille. Jaetaan numeron alue 10x10 ruudukoksi ja mitataan kunkin ruudun harmaasävyarvo niin, että täysin valkoinen ruutu saa arvon 255 ja täysin musta arvon 0. Tällä lailla olemme saaneet sata numeroa syötettäväksi neuroverkolle.
Laitetaan seuraavaksi väliin MLP-verkko, joka ottaa sata syötettä ja jossa on kymmenen ulostuloa. Annetaan kullekin ulostulolle nimi "nolla", "yksi", "kaksi"... ja niin edelleen. Ajatuksena on, että valitaan tunnistetuksi merkiksi se, jonka ulostulo saa suurimman arvon.
Seuraavaksi verkkoa opetetaan. Aluksi verkon painot ovat saaneet täysin satunnaisia arvoja. Kirjoitetaan nyt verkolle harjoituskappaleeksi numero nolla. Aluksi tietenkin myös verkon kymmenen ulostuloa saavat täysin satunnaisia arvoja. Opetusvaiheessa yritetään nyt muuttaa verkon painoja niin, että ensimmäinen ulostulo olisi ollut mahdollisimman suuri ja muut mahdollisimman pieniä. (Se miten painoja tulee muuttaa ei ole mitenkään yksinkertaista, mutta siihen on olemassa erilaisia algoritmeja. MLP-verkon tapauksessa kyseeseen tulee esimerkiksi stokastinen gradienttioptimointi. Esseen lopussa taas on kerrottu Hebbin oppimissäännöstä.) Tätä toistetaan monta kertaa kirjoittamalla verkolle koekappaleita eri numeroista ja joka kerralla yritetään muuttaa verkon painoja niin, että lopputulos osoittaisi mahdollisimman selkeästi oikeaa numeroa.
Lopulta verkko oppii tunnistamaan numeroita tietyllä tarkkuudella.
Toinen neuroverkkosovellusten tyyppi tunnetaan nimellä Plant Control. Tässä neuroverkko ohjaa jotain prosessia, jonka tilaa tarkkaillaan mittareilla. Päinvastoin kuin äsken, ei ole olemassa tarkkaa tietoa siitä, mikä on oikea tai väärä tapa ohjata prosessia. Sen sijaan voidaan lopputulosta analysoimalla todeta oliko tulos hyvä vai huono ja tästä annetaan neuroverkolle palautetta. Ja ihmeellistä kyllä, neuroverkko oppii ohjaamaan prosessia joskus jopa paremmin kuin ihminen.
Esimerkkejä Plant Control sovelluksista ovat varaston logistiikan optimointi tai vaikka hotellin hissijärjestelmän optimointi siten, että vieraiden odotusaika ja sähkönkulutus minimoituu.
Lopuksi hiven terminologiaa: Plant Control on online-oppimista, mikä tarkoittaa, että verkon painoja säädetään koko ajan samalla kuin prosessi on käynnissä. MLP-esimerkki taas oli offline-oppimista: Opetukseen käytetään opetusnäytteitä ja opetuksen jälkeen verkko on valmis käytettäväksi, mutta sitä ei enää opeteta käytön aikana.
Vastaavasti MLP-esimerkkiä kutsutaan ohjatuksi oppimiseksi, sillä verkolle kerrotaan opetusvaiheessa suoraan minkälaista vastausta haluttiin. Plant Control taas on ohjaamatonta oppimista, verkko hakee optimin itse.
Neuroverkoilla on joitain ominaisuuksia, jotka kovasti kiehtovat minua. Alla niistä kolme.
1. Neuroverkot oppivat itse suoraan esimerkistä.
Verkko alustetaan satunnaisesti ja sille annetaan opetusvaiheessa palautetta, joka kertoo mitä siltä odotetaan, mutta se ei sisällä mitään ohjelmoijan ennalta tekemää logiikkaa tyyliin “jos ylhäällä on ympyrä, niin kyseessä saattaa olla yhdeksikkö tai kahdeksikko”. Samalle verkolle voitaisiin opettaa joku täysin muu tehtävä, esimerkiksi hissin kulun optimointi, ja se oppisi vähitellen senkin.
2. Neuroverkkoja on vaikea analysoida (ns. blackbox-malli).
Vaikka verkko oppii tehtävän, siitä on hyvin vaikea nähdä mitä se on oppinut. Vaikka ylläoleva MLP-verkko osaa tunnistaa yhdeksikön oikein, sen painokertoimista tuskin irtoaa mitään tarinaa “yhdeksikön luonteesta”.
3. Neuroverkoilla on hyvä yleistyskyky.
Neuroverkko ei opi vain tunnistamaan niitä opetusnäytteitä joilla se opetetaan, vaan hyvin suurella tarkkuudella myös “samanlaisia” täysin uusia näytteitä.
Tämä on verrattavissa ihmisen kykyyn kohdata uusia tilanteita käyttämällä hyväkseen aiempia kokemuksiaan. Tämä on mielenkiintoinen ominaisuus, sillä ei ole itsestään selvää että näistä aiemmista kokemuksista voi olla mitään hyötyä, kun ne kerran ovat olleet erilaisia kuin nykyinen uusi tilanne.
On helppo huomata, miten ominaisuudet ovat samat kuin ihmisaivoilla. Tämäkin on ollut kiehtovaa, neuraalilaskennan kursseilla tarttuneen käsitteistön puitteissa on ollut mielenkiintoista tutkia omaa oppimista ja ajatusmaailman kehittymistä. (Tenttituloksen parantaminen “opetuskertoja” lisäämällä, eli tentin iterointi, on huonohko, mutta myötätuntoa herättävä esimerkki.)
Samankaltaisuus ihmisaivoihin ei loppujen lopuksi kuitenkaan ole mikään mullistava havainto, neuraalilaskennan menetelmäthän nimenomaan on lainattu aivotutkimuksesta. Joten mielenkiintoista on sittenkin se, että menetelmät pystyvät myös tietokoneeseen ahdettuina samantyyppisten ongelmien ratkaisemiseen kuin ihmisaivoissa. Varsinkin mielenkiintoista on se, miten yksinkertainen verkkorakenne taipuu niinkin mahdottomien ongelmien ratkaisuun kuin käsialan lukeminen, biometriikka (esimerkiksi ihmisen tunnistaminen valokuvasta), puheen ymmärtäminen, hissijärjestelmän optimointi ja varaston kiertoajan optimointi.
Yritetäänpäs tällaisen alustuksen jälkeen tarttua aiheesen vähän tiukemmalla otteella:
Määritelmä: Luova ajattelu on, se mitä tapahtuu, kun ratkaistaan ongelma, joka joiltakin osin on erilainen kuin kaikki ne ongelmat, joihin on jo olemassa ratkaisu.
Määritelmässä käytetty sana “ongelma” on ehkä turhan insinöörimäinen, arkikielessähän sillä tarkoitetaan jotain harmillista. Tässä tarkoituksena oli kuvata kaikkea mahdollista “uuden tekemistä”.
Edellä esitetyn perusteella voin nyt väittää, että neuroverkot kykenevät luovaan ajatteluun, mikä on sama kuin sanoa että niillä on hyvä yleistyskyky. Huomattavaa on, että perinteinen tietokoneohjelma ei missään tapauksessa kykene luovaan ajatteluun, sehän sisältää vain valmiita ohjeita: “jos olet tilanteessa 1 tee näin jos taas tilanteessa 2 tee näin”. Tietokoneohjelma on siis eräänlainen resepti, johon on tiivistetty se luova ajattelu, minkä ohjelmoija (parhaassa tapauksessa) tekee.
Väite että rakenteeltaan yksinkertaiset neuroverkot pystyvät luovaan ajatteluun on mielestäni hätkähdyttävä. Se tarkoittaa että rakenne, jossa yksinkertaiset neuronit keskustelevat toistensa kanssa yksinkertaisten synapsien välityksellä sisältää jotain, mikä kykenee luovaan ajatteluun. Tämän uskallan päätellä siitä, että paljon muuta neuroverkoissa ei ole kuin juuri tuo rakenne. Seuraava väite onkin sitten yritys lainata tätä rakennetta myös muuhun kuin insinöörien käyttöön:
Väite: Rakenne, jossa yksinkertaiset neuronit kommunikoivat toistensa kanssa jonkinlaisten synapsien välityksellä, kykenee luovaan ajatteluun.
Väitteen käsitteet kaipaavat täsmentämistä, sillä niitä ei ole koskaan aiemmin käytetty tässä merkityksessään.
“Jonkinlainen synapsi” tarkoittaa mitä tahansa kommunikointimuotoa, mikä kulloisenkin asiayhteyden yksinkertaisille neuroneille on sovelias. Lisäksi käsitteeseen sisältyy ajatus painokertoimesta, eli että kahden yksinkertaisen neuronin välinen synapsi, eli kommunikaatiokanava, voi olla vahvempi tai heikompi kuin kahden muun neuronin välinen synapsi.
“Yksinkertainen neuroni” on mikä tahansa, mikä pystyy jollain tavalla vastaanottamaan informaatiota, muokkaamaan sitä ja jollain tavalla lähettämään sitä. Eli toisin sanoen: pystyy kommunikoimaan jonkinlaisten synapsien välityksellä ja samalla muokkaamaan informaatiota, jota se kommunikoi.
Teorian jälkeen onkin sitten harjoitustehtävien vuoro. Neuraalilaskennasta lainatuilla silmälaseilla olen yrittänyt löytää neuroverkkorakenteita ympäriltäni, ja katsella liittyisikö niihin mahdollisesti luovaa ajattelua. Seuraavassa ei ole tarkoitus niinkään todistella mitään, vaan pikemminkin tunnustella mihin tällainen tarkastelutapa johtaa.
Palataanpa takaisin tämän tarinan alkulehdille, keskusteluun jota en muista. Vaikka sitä ei keskustelusta olisi uskonutkaan, niin siinä tapahtui luovaa ajattelua, mistä todisteeksi jäi hyvä idea. Nyt voisi tietenkin väittää, että ei tässä mitään ihmeellistä tapahtunut, kaksi ajattelevaa ihmistä, kyllähän siinä nyt jotain ajatusta pitääkin syntyä. Kuitenkin väitän, että se ajatus mikä syntyi, ei olisi syntynyt jos olisimme kumpikin ajatelleet erikseen, hiljaa itseksemme. Eli jossain tapahtui luovaa ajattelua, joka oli jotain muuta kuin kahden erillisen aivon ajattelun summa.
Kun edellä esitetyn terminologian valossa tarkastelee keskusteluamme, niin voisi väittää, että luovaa ajattelua synnytti kahden yksinkertaisen neuronin verkko, missä neuroneina esiintyivät minä ja vaimoni. (Erityisesti tulee tässä kohden mieleen neuroverkoille esittämäni toinen ominaisuus, jonka mukaan niitä on vaikea analysoida. Nythän kävi juuri niin, että keskusteluamme analysoimalla on hyvin vaikea ymmärtää mistä lopullinen ajatus oikein putkahti esiin.)
Tuntuu tietenkin aika yliammutulta väittää, että kahden neuronin verkko pystyisi niinkin monimutkaiseen tehtävään kuin "huomenna tapahtuvien arkisten asioiden pohdinta". Tämä johtuu kuitenkin siitä, että on vähän pelkistettyä väittää, että ihminen on “yksinkertainen neuroni”, vaikkakin ylläolevassa määritelmässäni jätin tarkoituksella tällaisen mahdollisuuden avoimeksi.
Toinen lähestymistapa onkin tarkastella asiaa aivosolujen tasolla. Meillä on kaksi pääkalloa, joiden sisällä selvästikin on neuroneista ja synapseista koostuva hermoverkko kummassakin. Tässä ei edes tarvitse turhaan selitellä mitään, sillä olemme nyt terminologiamme alkulähteillä. Eli kohtuullisella varmuudella voidaan sanoa, että aivoissa tapahtuu ajattelua. Ja edellä esitetyn mukaan ajattelu on luonteeltaan sellaista, että neuronit kommunikoivat keskenään sähköisten synapsien välityksellä.
Nyt kuitenkin kaikki kommunikaatio lasketaan synapsiksi, joten esimerkiksi kaikki hormonaalinen toiminta, mitä jotkut hermosolut säätelevät ja mikä toisiin hermosoluihin vaikuttaa, on myös “jonkinlainen synapsi”. Mitä muuta neuronien välistä kommunikaatiota löytyy? Selvästikin vaimoni pääkopassa tapahtuva ajatustoiminta johtaa jossain vaiheessa puheeseen, minkä minun kuulohermosoluni taas vastaanottavat, mikä taas synnyttää minussa ajatustoimintaa. Sama tietenkin näköaistin kautta, sillä henkilön liikkeet ja ilmeet ovat myös aivosolujen synnyttämiä. Ja miksei kommunikointia voi tapahtua myös hajuaistin välityksellä, (ei piirretty kuvaan) kuten myös tunto- ja makuaistin mukana, niinkuin vaimoni ollessa kyseessä joskus käykin. Eli toisessa pääkallossa olevat neuronit kommunikoivat toisen pääkallon neuronien kanssa!
Sen sijaan että tarkasteltaisiin kahta ihmistä jotka yhdessä, mutta kuitenkin erillisinä henkilöinä, ajattelevat, voidaankin tarkastella tilannetta yhtenä kokonaisena neuroverkkona, joka on kooltaan kahden ihmisaivon kokoinen.
En ole biologi enkä aivokirurgi, mutta käsittääkseni esimerkiksi muistimme koostuu niin kutsutuista muistijäljistä. Jos meillä on muistikuva lapsuudesta, niin se on tallennettuna (vaikeasti analysoitavalla, ihmeellisellä tavalla) sähköiseksi radaksi aivojemme neuroneihin ja synapseihin. Kun muistamme, sähkö kulkee tuossa radassa. Myös ajattelumme on samanlaista sähköisten ratojen sykettä.
Jos nyt laajennamme tätä kuvaa ja tarkastellaan taas kahta aivollista neuroneja, herää kysymys, miksi tällaisia ratoja ei voisi muodostua myös useamman pääkopan poikki. Ja nimenomaan niin, että nämä radat yksinään eivät olisi osittaisia ajatuksia, joista isompi ajatus muodostuu, vaan kyseessä olisi aito ajatusrata vain kokonaisena. Tuntuisi ainakin mahdolliselta, että näin voi käydä.
Äskeinen tarkastelu menikin jo aika syvälliselle tasolle, lopuksi vieläpä sellaiseen suuntaan missä itse olen hieman hukassa. Kappaletta voisi pitää jonkinlaisena ajattelun metafysiikkana ja mielenkiintoista tarkastelua voisi varmaan jatkaakin vielä, mutta itseäni kiinnostaisi tehdä pieni irtiotto hermosoluista ja päästä vähän korkeammalle tasolle.
Tarkastelimme äsken sellaista ajattelua, mitä voisi syntyä kun kaksi pääkallollista aivosoluja saatetaan yhteen. Väitän että tällainen ajattelu on jotain enemmän kuin mitä näissä pääkalloissa erikseen tapahtuu. Kutsun tätä tapahtumaa, missä ihmisjoukko ajattelee, kollektiiviseksi ajatteluksi.
Minun ja vaimoni kollektiivisen ajattelun mallintaminen kahden yksinkertaisen neuronin verkkona ei alkuun tuntunut aivan luontevalta. Sen sijaan hermosolutasolle menevä selitys ainakin tuntuu uskottavalta, tai sitten se on vain sen verran monimutkaisempi, että sitä ei suoralta kädeltä pysty tyrmäämään.
Insinöörinä minua kuitenkin kiinnostaisi päästä leikkimään sillä tasolla, missä ihmiset ovat yksinkertaisia neuroneja. Tämä siksi, koska yhden ihmisen kainalohien ja toisen ihmisen hajuaistin muodostamaa aivosolujen välistä synapsia on kovin vaikea määrittää mitenkään järkevästi. Sitä voi selitellä ja väittää, että jossain tapahtuu jotain, mikä ehkä on ajattelua. Mutta loppujen lopuksi selityksistä tulee yhtä hyviä kuin filosofien metafysiikoista yleensäkin. Jos sen sijaan voitaisiin edes jonkinlaisin perustein luoda teoria, jossa ihmiset ovat yksinkertaisia neuroneja ja heidät voidaan istuttaa toimistoon MLP-verkon muotoon ja luova tiimityö kukoistaa, niin voisin insinöörinä tuntea keksineeni jotain.
Tällainen malli, jossa kainalohiki ja intellektuellit gurumurahtelut niputetaan yhdeksi synapsiksi, olisi tietenkin yksinkertaistus todellisuudesta. Mutta niin ovat monet muutkin tieteen parhaista keksinnöistä. Lisäksi täytyy muistaa neuroverkkojen ominaisuus, jonka mukaan ne kykenevät luovaan ajatteluun vaikka onkin vaikea analysoida miksi. Kollektiivista ajatteluakin voi siis esiintyä, vaikka emme pystyisi - tai edes pyrkisi - tarkasti sanomaan missä.
Lisäksi otan tuekseni taas yhden neuroverkkosovelluksen - nimittäin komiteakoneet. Komiteakone on neuroverkko joka koostuu neuroverkoista. Yksinkertaiset neuroverkot voidaan opettaa ratkaisemaan osa ongelmaa, minkä jälkeen kunkin verkon ulostulo kytketään omilla painokertoimillaan toisiinsa ja näin saadaan komiteakoneen antama tulos.
Siis voimme tarkastella ihmisiä "yksinkertaisina neuroneina", koska vaikkakin ihminen itsessäänkin on neuroverkko, haluamme tällä kertaa tutkia kollektiivisesta ajattelusta sitä osaa, joka koostuu ihmisten välisistä synapseista. Lähtökohta on siis sama kuin jos komiteakoneessa tutkittaisiin vain verkkoja yhdistävää gating-verkkoa. Gating-verkon tarkastelu ei tarkoita, että se on koko komiteakone, vaan että olemme keskittyneet verkon siihen osa-alueeseen. Vaikka siis pohjimmiltaan aivosolut ovatkin se, mikä luo kollektiivisen ajattelun, voimme - tai toivon että jollakin tarkkuudella voimme - niputtaa kunkin henkilön omat aivosolut yhdeksi kokonaisuudeksi ja tarkastella näiden kokonaisuuksien, eli ihmisten, välistä vuorovaikutusta.
Insinöörinä täytyy heti tietenkin tarkastella, mikä on se luovan ajattelun määrä, mikä näin syntyy. En nyt oikeasti väitä että tällaista pystyisi laskemaan, itse en juurikaan ole koskaan uskonut edes älykkyysosamääriä laskeviin testeihin. Mutta “mittaaminen” antaa kuitenkin mahdollisuuden lähestyä asiaa edes jostain suunnasta.
Jos ajatellaan neuroverkon rakennetta, niin sen kapasiteetti on varmaan suhteessa neuronien, mutta myös synapsien määrään. Neuroverkon kapasiteettia voidaan siis kasvattaa joko neuroneja tai synapseja lisäämällä. Huomattavaa on, että jos neuronien määrä kaksinkertaistuu, niin synapsien määrä voi parhaimmillaan kasvaa potenssiin kaksi suhteessa neuronien määrään.
Jos ajatellaan että yksi ihminen tuottaa yhden aivollisen verran ajatuksia, niin kaksi ihmistä tuottavat varmaan kaksi aivollista. Jos nämä ihmiset lisäksi kommunikoivat keskenään, alkaa heidän välilleen syntyä "jonkinlaisia synapseja". Ajattelun määrää voidaan siis kasvattaa joko ihmisiä (neuroneja) tai keskustelua (synapseja) lisäämällä.
Eli tiivistettynä: N henkilön kollektiivisen ajattelun määrä on jotain välillä [Nx .. xN] suhteessa yhden henkilön ajattelun määrään x. Potentiaalisesti siis ajattelun määrä voisi kasvaa eksponentiaalisesti neuroverkon kasvaessa!
Tietenkään en väitä, että pelkästään keskustelemalla syntyvät jonkinlaiset synapsit olisivat yhtä vahvoja kuin aivojen sisällä olevat aidot synapsit, tai että jonkinlaisia synapseja syntyisi lähellekään tuo määrä, eli jokainen neuroni yhdessä pääkallossa vaikuttaisi suoraan jokaiseen neuroniin toisessa pääkallossa, mutta kyseessä on kuitenkin jonkinlainen yläraja.
Siis ryhmän kollektiivisen ajattelun kapasiteetti olisi enemmän kuin aivojen yhteenlaskettu määrä (lineaarinen kasvu), mutta kasvu korkeintaan olisi eksponentiaalista (synapsien määrä).
Matlab-sovelluksissa, missä neuroverkot ovat tähän asti eläneet, pyritään yleensä löytämään mahdollisimman pieni ja yksinkertainen verkko, joka riittää ongelman ratkaisuun. Tämä siksi, että isompi verkko vaatii tietenkin paljon enemmän laskentakapasiteettia. Tietokonesovelluksissa verkkoa pyörittääkin oikeasti yksi Intelin (tai Digitalin tai HP:n) prosessori ja verkon neuronit syövät kaikki tätä yhteistä kapasiteettia.
Meidän ihmisistä koostuvassa neuroverkossa tilanne on kuitenkin päinvastoin. Jokainen ihminen on oma prosessorinsa ja uusien ihmisneuronien lisääminen vain lisää laskentatehoa. (Ja näin olisi myös jos lähdettäisiin rakentamaan aitoa neurotietokonetta rautatasolla.) Sen sijaan elävässä elämässä pullonkaulaksi muodostuu äkkiä kommunikaation järjestäminen eli synapsien luominen. Ja kuten tiedämme, ilman "jonkinlaisia synapseja" ei synny minkäänlaista kollektiivista ajattelua. Tästä voisin taas tehdä pari lausahdusta:
Väite: Ihmisistä koostuvan kollektiivisen ajattelun neuroverkon ajattelukapasiteettia voi parantaa kehittämällä kunkin yksittäisen henkilön ajattelua tai lisäämällä henkilöiden määrää. Tällöin vaikutus suhteessa kokonaisuuteen on lineaarinen.
Väite: Ihmisistä koostuvan kollektiivisen ajattelun neuroverkon ajattelukapasiteettia voi parantaa kehittämällä ihmisten välistä kommunikaatiota. Tällöin vaikutus suhteessa kokonaisuuteen on (ainakin potentiaalisesti) eksponentiaalinen.
Tästä voi tehdä johtopäätöksen, että minkä tahansa ryhmän luovuutta voi dramaattisesti parantaa kehittämällä ryhmän sisäistä kommunikaatiota.
Keksin heti kaksi osa-aluetta joihin siinä tapauksessa on kiinnitettävä huomiota. Ensiksikin hedelmällisen kommunikoinnin järjestäminen vaikkapa sadan tai tuhannen hengen yhteisölle voi olla ja onkin logistinen ongelma. Tämän lisäksi voi olla, että kommunikointi on teknisesti mahdollista, mutta sitä ei sittenkään tapahdu, tai se on vähäistä tai “huonolaatuista”. Esimerkiksi vaimoni kanssa meillä on hyvinkin optimaaliset kommunikointiolosuhteet, sillä vietämme paljon aikaa fyysisesti samassa paikassa, asunnossamme. Tämähän ei kuitenkaan takaa juuri mitään, kuten hyvin kaikki tiedämme. Toinen ongelma onkin nimenomaan panostaminen kommunikoinnin laatuun. Sellaisen tilan saavuttaminen, missä ajatus pääsee oikeasti virtaamaan. Oli lähellä, että olisin tässä kirjoittanut, että päämäränä on toistensa ymmärtäminen. Tämä johtaa kuitenkin helposti väärinkäsityksiin, sillä kuten vaimoni kanssa käymässäni keskustelussa kävi ilmi, emme varsinaisesti ymmärtäneet toisiamme, mutta jossakin tapahtui kuitenkin hedelmällistä kommunikaatiota, joka johti luovaan ajatteluun. Kommunikaation laatua on siis vaikea tarkemmin määritellä, kuin että ajatus pääsee virtaamaan.
Päätän tämän osan pariin esimerkkiin. Ensiksi aihe nimeltä “tyhmien kysymysten esittäminen”. Ajatellaan vaikkapa luentotilannetta. Joskus on käynyt niin, että haluaisin kysyä jotain mitä en oikein ymmärtänyt, mutta koska en oikein ymmärtänyt mitään, on vaikea esittää kysymystäkään. Jos kuitenkin esitän kysymyksen, on todennäköistä että luennoitsijan on vaikea vastata sekavaan ja puutteelliseen (eli tyhmään) kysymykseeni ja vastauksestakin tulee aika surkea. Kuitenkin edellä esitetyn valossa tyhmien kysymysten esittäminen on paljon parempi kuin että mitään kysymystä ei esitetä, sillä juuri sellaisessa tilanteessa kollektiivinen ajattelu kukkii. (Tämän esimerkin tulkinnassa piilee vaara. Tyypillinen TKK:n luento ei mielestäni ole hyvä esimerkki kollektiivisesta ajattelusta. Luento tuo enemmänkin mieleen kuvan jossa luennoitsija yrittää isolla kauhalla lapioida tietoa oppilaiden pieniin kuppeihin. Tällainen ei mitenkään liity kollektiiviseen ajatteluun, ja toivonkin että unohdatte nyt tämän kappaleen kokonaan.)
Toinen esimerkki on Linuxin kehtiys. Analysoidessaan Linuxin kehitystä ja Open Source työtapaa yleensä, Eric Raymond väittää, että Linusin keksintö ei ollut niinkään teknologinen vaan sosiaalinen. Menestyvän Open Source projektin salaisuuksia ovat “release early, release often” ja "I sent chatty announcements to the beta list whenever I released, encouraging people to participate”. Eli Linusin salaisuus piili siinä, että hän onnistui luomaan hedelmällistä kommunikaatiota niiden henkilöiden välille, jotka sitten (kollektiivisesti) tekivät koko työn.
Koska olen jo ylittänyt tälle esseelle sallitut fyysiset rajat, haluan nyt päättää lyhyellä esimerkillä neuraalilaskennan opetusten soveltamisesta kollektiivisen ajattelun analysointiin, eli laveasti sanottuna ihmisten välisiin suhteisiin. Tällaisiin tarkasteluihin pääseminen oli motivaattorina, kun kehittelin ajatuksia, jotka juuri olet lukenut. Mutta nyt kun olemme vihdoin päässeet tähän asti, täytyy sanoa että kehittely itsessään on ollut mielenkiintoinen, mahdollisesti jopa mielenkiintoisempi kuin mitä näistä tarkasteluista tulee.
Eräs neuroverkon opetussääntö on nimetty keksijänsä mukaan: Hebbian learning. Se on ensimmäisiä neuraalilaskennan sääntöjä, ja kuulemma hyvin todenmukaisesti jäljittelee sitä prosessia mitä aivoissakin tapahtuu. Se on luonteeltaan ohjaamatonta oppimista ja johtaa neuroverkkoon, jossa verkon osat erikoistuvat eri asioihin.
Hebbin opetussääntö: Olkoon kahden neuronin x ja y välinen painokerroin w. Merkitään neuronin x aktivaatiofunktion arvoa f(x) ja vastaavasti y:n f(y). Tällöin painokerrointa w päivitetään seuraavasti:
w(uusi) = w(vanha) + a * f(x) * f(y) ,
missä a on kerroin, jolla säädellään opetuksen voimakkuutta. Hebbin opetussääntö siis vahvistaa synapsia silloin, kun neuronien aktivaatio on samanmerkkistä (positiivinen korrelaatio), ja heikentää sitä silloin, kun neuronit ovat aktivoituneet erilailla (negatiivinen korrelaatio).
Tarkastellaan nyt suomalaista yhteiskuntaa kollektiivisen ajattelun neuroverkkona. Verkon neuroneja ovat Suomessa asuvat ihmiset (ja miksei eläimetkin) ja synapseja ovat heidän väliset suhteensa. Ilmiselvästi tässä verkossa tapahtuu Hebbin oppimista:
Minä olen yksi tämän verkon neuroneista. Synnyin sattumalta Pietarsaareen, Permon kaupunginosaan. Heti aluksi synapsit vanhempiini olivat hyvin vahvoja, joten se miten aktivoiduin korreloi vahvasti heidän mukaansa. Vastaavasti satunnaisen Itä-Suomessa asuvan henkilön kanssa korrelaatio oli lähellä nollaa. Tämä ei vielä ole Hebbin oppimista, vaan kyse on jokseenikin päinvastaisesta asiasta. Jos neuronien välillä ei ole kytköksiä, niiden aktivoituminen ei tietenkään voi korreloida, vaan ne ovat toisistaan riippumattomia. (Riippumattomuus voidaan haluttaessa määritellä juuri korreloimattomuutena.)
Tämän jälkeen synapsit lähellä asuviin naapureihini alkoivat vahvistua, varsinkin samanikäisiin leikkitovereihin. Pihapiiristä on perua eräs nuoruuden harrastuksistani - jalkapallo. Toisaalta en kovin paljoa ole koskaan pelannut jääkiekkoa. Lieneekö sattumaa että Pietarsaaressa on myös eräs maineikas jalkapalloseura Jaro, kun taas jääkiekkoseurat tunnetaan lähinnä konkursseistaan ja yhdestä vuodesta ykkösdivisioonan peränpitäjänä.
Myöhemmin olin myös jalkapallossa erotuomarina. Ja koska sama erotuomarikerho otti hoitaakseen nousevan lajin - salibandyn - erotuomaritehtävät, niin tein sitäkin ja sitä kautta minusta tuli myös innokas salibandyn pelaaja. Vastaavasti jalkapalloerotuomarit eivät pääsääntöisesti toimineet jääkiekko- tai kaukalopallotuomareina, joten synapsini sinne päin säilyivät heikkoina.
Koulussa taas ajatusmaailmani korreloi parhaiten fysiikan opettajan kanssa. Koska aihe kiinnosti minua, olin myös hyvä siinä ja koska olin hyvä siinä se kiinnosti minua enemmän ja enemmän. Lopulta päädyin Otaniemeen opiskelemaan fysiikkaa oikein tosissani ja vietin yhä enemmän aikaa fysiikan ja fyysikoiden parissa. Synapsit kotiseudulle päin heikkenivät kun taas pääkaupunkiseutu alkoi käydä tutummaksi. Koska fysiikan opiskelu vaati paljon aikaa ja keskittymistä, alkoi salibandyn peluukin jäädä vähemmälle, jalkapallon olin jo joutunut lopettamaan lukiossa. Sen sijaan Otaniemessä vastaan tuli vahvasti kehittyvä teknologinen ilmiö nimeltä Internet. Verkkoteknologiat, ohjelmointi ja media alkoivatkin kiinnostaa ja huomaan, että tällä hetkellä vietän yhä vähemmän aikaa fysiikan osastolla ja yhä enemmän Tikkitalolla. Vapaa-aikanakin vietän aikaa esimerkiksi webcastingin parissa ja kaveritkin ovat valikoituneet sen mukaan.
Kun tarkastelen elämääni, niin on helppo huomata miten synapsit samanmielisiin ihmisiin helposti vahvistuvat, kun taas täysin erilaisten ihmisten kanssa tulee vietettyä aina vaan vähemmän aikaa. Yksilölliseltä kannalta tarkasteltuna tämä ei edes välttämättä ole hyvä asia. Se merkitsee, että olen elämässäni luopunut monesta asiasta ja sanotaankin että erilaisuus on rikkautta. Kuitenkin jos tarkastellaan Suomea kokonaisuutena, se tarkoittaa että neuroverkko on oppinut. Sen eri osat ovat erikoistuneet kukin omaan tehtäväänsä ja verkko oppii tekemään yhä erikoisempia asioita ratkoessaan ongelmaa jonka nimi on Elämä.
Tämän esseen oli tarkoitus käsitellä kollektiivista ajattelua. Sen puolivälissä puhuimme luovasta ajattelusta ja esitin väitteen, että rakenne jossa yksinkertaiset neuronit kommunikoivat toistensa kanssa jonkinlaisten synapsien välityksellä, kykenee luovaan ajatteluun. Jos tämä on totta - tai jos haluamme tutkia, josko tämä voisi olla totta - kannattaa katsella ympärilleen josko tällaisia rakenteita löytyisi muualta kuin neuraalilaskennan ja aivotutkimuksen luennoilta. Esseen käsittely kollektiivisesta ajattelusta on yksi ehdotus tällaiseksi rakenteeksi. Mistä muualta tällaisia rakenteita voisi lyötyä?
Kun sikiö on kehittynyt tiettyyn ikään, sille alkaa muodostua muun muassa hermosoluja. Tietenkin myös sikiön äidillä on paljon hermosoluja ja aivan varmasti äidin ja sikiön välillä tapahtuu paljon vuorovaikutusta. Huomaatteko?
Mitähän tällainen sikiö-äiti mahdollisesti luovasti ajattelee? Minulla ei tietenkään ole aavistustakaan. Myönnän iloisesti, että seuraava on täydellinen hutaisu pimeään, mutta mikä sopisikaan paremmin tämän esseen epilogiksi!
Jos lukion biologian opettajani (ja kirjani) puhuivat totta ja jos tilanne ei ole lukioaikojeni jälkeen radikaalisti muuttunut (molempiin suhtaudun kylläkin terveellä ja vahvalla epäilyllä), niin eläimien vaistojen alkuperää ei tunneta. Sanakirjan mukaan vaistotoiminnat ovat “synnynnäisiä, lajityypillisiä ja lähes kaavamaisen muuttumattomia”. Synnynnäisyys on jollakin tavalla vaistojen määritelmä, sillä sehän juuri tarkoittaa opitun vastakohtaa.
Muistan (lukiosta) että jotkut eläimet pystyivät vaistomaisesti hyvinkin monimutkaisiin toimintoihin ja mikä kiehtovampaa, nämä toiminnot olivat yleensä elintärkeitä. Esimerkiksi eräskin lintu osasi nokallaan pyöräyttää munan takaisin pesään, kun se oli tipahtanut pesän viereen. Kaavamaisuus tuli hyvin esille, kun tiedemies ottikin munan kesken kaiken pois ja lintu uskollisesti jatkoi hassunkurista nokan kääntelyä.
Koska vaistotoiminnot ovat synnynnäisiä ja lajityypillisiä, epäiltiin lukion kirjassa, että ne ovat geneettistä alkuperää. En muista, että tämä kuitenkaan olisi ollut täysin varmaa. Jos ne ovat geneettistä alkuperää, niin äsken kuvaamani munanpyöräytystemppu saisi kyllä evoluution ja luonnovalinnan kuulostamaan vielä entistäkin ihmeellisemmältä.
Tämä essee antaa minulle mahdollisuuden ehdottaa, että tällaiset vaistot olisivat sekä opittuja, että synnynnäisiä. Eli että sikiö oppisi joitakin asioita suoraan emon hermosoluista. Kun äiti syö, hermoradat sykkivät sähköisesti ja on aivan selvää, että nämä signaalit ovat sikiön havaittavissa. Sikiön uunituoreet hermosolut ovat tietenkin äärettömän oppivassa tilassa ja ne oppivat matkimaan näitä ratoja. Ja seurauksena sikiö osaa imeä emon nänniä heti synnyttyään ja kaupan päälliseksi niellä ruuan kurkusta alas.
Jos tämä olisi totta, niin hakisin ensi vuonna Nobelin palkintoa. On selvää, että itsekin uskon siihen vain juuri niin paljon että kehtaan kirjoittaa tätä. Paradoksaalista kyllä, päin vastoin kuin esseen muille aiheille, tämä ilmiö on empiirisesti kokeiltavissa hyvinkin helposti, joten se ei ole ainakaan pseudotiedettä vaikka älytöntä olisikin. Kuvaan seuraavassa kokeen nimeltä “Pavlovin pennut”, jolla voidaan jalostaa koirarotu, jonka jälkeläiset kuolaavat aina kellojen soidessa. (Miettikääpä minkä vaikutelman tällainen koira tekisi tasatunnein hautausmaalla!)
Koulutetaan naaraskoiraa “Pavlovin koiraksi” eli soitetaan kelloa aina ruokinta aikaan. Kun koira on ehdollistunut niin, että kuola valuu aina heti kun kelloja soitetaan, tuodaan paikalle uros ja tehdään pentuja. Soitellaan kelloja raskausaikana, mutta kun pennut syntyvät ei koskaan soiteta kelloja ruoka-aikaan. Kokeillaan kuolaavatko pennut kun kelloja soitetaan ja pidetään peukkuja.
This work is dedicated to the
Public Domain.