Numerosokeus - kansainvälinen vitsaus

"The purpose of computation is insight, not numbers"
(Richard W. Hamming, 1915-1998)

Syksyllä 1998 Helsingin Sanomissa kerrottiin Pohjois-Suomessa olevasta 154 000 hehtaarin metsäalueesta. Kirjoittaja halusi havainnollistaa metsän suuruutta ja kertoi, että alue vastaa 154 kilometrin pituista ja sadan metrin levyistä kaistaletta. Todella iso alue! Valitettavasti laskelma oli väärin, minkä lukijat huomasivat. Korjauksessa väitettiin, että alueen pituus on 1 540 kilometriä. Tämäkin oli väärin. Toinen korjaus tuotti vihdoin oikean tuloksen: sata metriä leveän kaistaleen pituus olisi 15 400 kilometriä.

Numerosokeus ei ole pelkästään suomalaisten ongelma. Vuonna 1996 julkistivat Intel-yhtiö ja USA:n energiaministeriö (DOE) tiedotteen, jossa kerrottiin uudesta ASCI Red -supertietokoneesta. Tämän koneen huipputeho on yli 1000 miljardia laskutoimitusta sekunnissa (1 teraflop/s). Tiedotteen mukaan kone on niin nopea, että USA:n väestöltä (lapset mukaan lukien) veisi 125 vuotta laskea taskulaskimella se määrä laskutoimituksia, minkä ASCI Red laskee sekunnissa.

Intelin ja DOE:n väite on miljoona kertaa liioiteltu - USA:n väestö pystyy tekemään laskutoimitukset noin tunnissa. Tiedotteen virhe johtuu sanan "triljoona" erilaisista merkityksistä: triljoona on USA:ssa 1012 eli 1 000 000 000 000 ja Euroopassa 1018 eli 1 000 000 000 000 000 000. Lukusanat miljardi ja "billion" sekä biljoona ja "trillion" aiheuttavatkin jatkuvia ongelmia amerikkalaisten ja eurooppalaisten keskusteluissa.

Vuonna 1998 julkistetusssa DOE:n uudessa lehdistötiedotteessa verrattiin superkoneen tehoa yhden ihmisen laskutehoon. Tällä kertaa laskelma oli periaatteessa oikein.

Suuret luvut aiheuttavat jatkuvasti ongelmia. New Scientist kertoi ihmisen geeniperimän selvittämisestä ja väitti, että ihmisen geeneihin sisältyy 30 miljardia emäsparia. Oikea arvo on 3 miljardia emäsparia. Projektin keston kannalta tämä on olennainen lukuarvo.

Suuruusluokkien arviointi

Niin kutsuttu tieteellinen merkintätapa tarkoittaa lukujen ilmaisemista muodossa 4,567 x 108$ eli käyttämällä apuna kymmenen potensseja. Tämä merkintätapa on välttämätön suurten tai pienten lukujen esittämisessä. Ilman potenssimerkintää joutuisimme kirjoittamaan edellä mainitun luvun muodossa 456 700 000, josta on huomattavasti vaikeampi hahmottaa luvun suuruusluokka. Lisäksi tieteellinen merkintätapa kertoo, kuinka tarkasti suure on mitattu: edellä tarkkuutta oli neljä desimaalia eli todellinen lukuarvo lienee välillä 456 650 000 ... 456 750 000.

Jokaisen pitäisi kyetä käyttämään lukujen tieteellistä merkintätapaa, mutta jostain syystä sitä käytetään erittäin harvoin lehdissä tai yleistajuisessa kirjallisuudessa. Merkintätapa säästää paljon mieliharmia ja lukujen väärintulkintoja, kuten edellä lukusanan "triljoona" kohdalla.

Suuruusluokkien hahmottaminen on vaikeaa mm. tilavuuksien, pinta-alojen ja pituuksien vertaamisessa. Ajatelkaamme vaikkapa kuutiometrin suuruista määrää kuparilevyjä. Jos kuparilevyjen paksuus on yksi millimetri, kuutiometristä kuparia saa 1000 neliömetrin kuparikatteen. Saamme katettua siis noin 31 m x 31 m kokoisen alueen.

Entä kuinka pitkän langan saisi kuutiometristä kuparia? Jos langan poikkileikkauksen ala on yksi neliömillimetri, saamme kuparilangan pituudeksi tuhat kilometriä. Lanka ulottuisi suunnilleen Suomen päästä päähän. Tässä on vielä jatkokysymyksiä: Kuinka paljon kuparia tarvittaisiin maapallon ympäri vedettävään kuparilankaan? Paljonko tämä kuparimäärä vie tilaa kuution muotoisena kappaleena eli mikä on kuution särmän pituus?

Kaikissa edellisen tyyppisissä laskelmissa on syytä käyttää lukujen tieteellistä merkintätapaa. Toinen tapa havainnollistaa suuria lukuja on verrata niitä johonkin konkreettiseen. Esimerkiksi aurinkokunnan kokoa voi havainnollistaa mittakaavassa 1:109 eli yhden suhde miljardiin. Aurinko on tällöin noin metrin läpimittainen pallo ja maapallo on noin 150 metrin päässä. Mikä on maapallon halkaisija? Miten kaukana on Mars, Jupiter tai Pluto?

Lukujen taidon kehittäminen

John Allen Pauloksen kirjassa Innumeracy (suomennettu nimellä Numerotaidottomuus) on mainioita harjoituksia "lukujen taidon" kehittämiseen. Paulos tuo esille, kuinka tärkeää on, ettei lukuihin suhtauduta kritiikittömästi. Luvut pitäisi käsittää välineiksi, joiden avulla on mahdollista tutkia väitteiden todenperäisyyttä tai verrata eri vaihtoehtoja toisiinsa.

Arvioikaamme Helsingissä työskentelevien pianonvirittäjien lukumäärää. Ensinnäkin tarvitsemme arvion pianojen määrälle Helsingissä. Olettakaamme, että joka kymmenennessä perheessä on piano ja perheen keskimääräinen koko on kolme ihmistä. Koska Helsingissä on noin puoli miljoonaa asukasta, saamme pianojen määräksi noin 15 000. Jos yksi pianonvirittäjä virittää kaksi pianoa päivässä ja vuodessa on 200 työpäivää, ehtii hän virittämään 400 pianoa vuodessa. Jos kukin Helsingin pianoista viritetään kerran vuodessa, tarvitaan tähän noin 40 pianonvirittäjää.

Arvio pianonvirittäjien määrällä on hyvin ylimalkainen ja osoittaa lähinnä oikean suuruusluokan. Olisin kuitenkin hyvin yllättäynyt, jos Helsingistä löytyisi yli 400 tai alle 4 pianonvirittäjää. Edellä tehtyä arviota voi verrata Helsingin puhelinluettelon keltaisten sivujen ilmoituksiin: 56 pianonvirittäjää mainostaa palvelujaan. Aivan kaikki pianonvirittäjät eivät tietenkään ilmoittele keltaisilla sivuilla, mutta toisaalta osa pianonvirittäjistä tekee myös korjauksia ja huoltotöitä.

Edellä kuvatun kaltaisia laskelmia joutuu tekemään esimerkiksi harkittaessa uuden yrityksen perustamista: riittääkö yritykselle asiakkaita vaihtoehtoisissa sijoituspaikoissa? Tässä voi karkeastakin laskelmasta olla arvaamaton apu. Näin mahdollisuuksista karsiutuvat pois ne paikat, jotka eivät missään tapauksessa tule kysymykseen. Vastaavasti voi esimerkiksi tarkistaa, pitääkö ostoskeskuksen ilmoitus odotettavissa olevasta asiakasmäärästä suunnilleen paikkansa.

Suuruusluokan arviointi auttaa myös kaupan kassalla: kun tiedän ostosten likimääräisen loppusumman, en tule huijatuksi. Italiassa tai Turkissa on myös hyötyä siitä, että pystyy muuntamaan hinnat likimääräisesti Suomen markoiksi. Italian osalta tämä ongelma tosin poistuu päiväjärjestyksestä euron myötä.

Todennäköisyyksien arviointi

Ihminen on hyvä löytämään säännönmukaisuuksia sellaisistakin tapahtumista, jotka ovat täysin satunnaisia. Ne esi-isämme, jotka kykenivät tehokkaasti havaitsemaan saalistajia tai saaliseläimiä, jäivät todennäköisesti henkiin. Ne jotka eivät huomanneet syy-yhteyttä vaikkapa vatsakivun ja tietyn tyyppisten hedelmien syönnin välillä selvisivät huonommin.

Pelkkä havainnointi tuottaa kuitenkin vain hypoteeseja ja johtaa helposti uskomuksiin, joilla ei ole tekemistä todellisuuden kanssa. Tämän vuoksi tieteellinen metodi korostaakin kokeiden merkitystä: hypoteesi pitää varmentaa vaikkapa kaksoissokkotestillä. Ilman tieteellistä metodia ajaudumme pseudotieteisiin kuten astrologiaan ja New Age~-ilmiöihin, joissa varmistamattomat hypoteesit hyväksytään sellaisinaan.

Tapahtumien todennäköisyyksiin liittyy paljon uskomuksia. Me ihmiset yleistämme sattumuksia ja helposti korostamme itseämme kohdanneita yhteensattumia. Ajatelkaamme vaikkapa ns. enneunia. Olettakaamme, että näemme (ja muistamme seuraavina päivinä) keskimäärin sata unta vuodessa. Oletetaan, että joka miljoonas uni vastaa likimäärin jotain lähiaikojen tapahtumaa. Suomen väestö näkee noin 500 miljoonaa unta vuodessa, joista kertyy 500 potentiaalista enneunta vuodessa. Kukaan ei tietenkään kerro tuttavilleen unista, jotka eivät vastaa tulevaisuuden tapahtumia, mutta luultavasti ainakin muutama näistä 500:sta "enneunesta" päätyy lopulta jonkin lehden palstoille. Ja kas kummaa, taas tuli uusi todiste unien ennustuskyvystä.

Kun ihminen virittyy seuraamaan ympäristöään tietyin odotuksin, löytää hän yllättävän paljon todisteita näkökulmalleen - ja unohtaa vastaesimerkit. Arkipäiväinen esimerkki tästä on autokauppa: jos ostan itselleni tietyn merkkisen auton, näen kohta liikenteessä ylen määrin samanlaisia autoja. Hyvä esimerkki on myös viereisten kassajonojen nopeus: moni pohtii, miksi aina joutuu hitaimpaan kassajonoon. Kummallisuutta voi selittää esimerkiksi seuraavasti: jos oman jononi kummallakin puolella on kassajono, on hyvin todennäköistä, että jompikumpi näistä on omaani nopeampi.

Osakemarkkinat tai uhkapeli on esimerkki kollektiivisesta harhasta. Häviäjät harvoin kertovat epäonnestaan mutta voittajat nousevat esille. Täten peliautomaatti ääntelee ja vilkuttaa valoja voiton sattuessa. Ihmisille saattaa siten tulla illuusio huomattavien voittojen mahdollisuuksista, vaikka todellisuudessa useimmat osakemarkkinoille tai uhkapeliin osallistujista häviäisivät panoksensa. Samaan ideaan perustuvat ketjukirjeet ja erilaiset "rikastu nopeasti"-huijaukset.

Ihmeellistä mutta todennäköistä

Todennäköisyyksien laskeminen johtaa monenlaisiin yllättäviin huomioihin. Ajatelkaamme esimerkiksi todennäköisyyttä sille, että ihmisryhmästä löytyy henkilöitä, joilla on sama syntymäpäivä. Jotta voisimme olla varmoja tästä, täytyisi joukossa olla 367 ihmistä (selitä miksi!). Samojen syntymäpäivien lähes varmaan esiintymiseen tarvitaan kuitenkin paljon vähemmän ihmisiä. Esimerkiksi Tieteellinen laskenta Oy:ssä (CSC) on 70 työntekijää ja todennäköisyys sille, että kahdella tai useammalla on sama syntymäpäivä, on yli 99,9% (todennäköisyys saadaan jakamalla luku 365 x 364 x 363 x ... x 296 luvulla 36570 ja vähentämällä tulos luvusta 1).

Voit itse tarkistaa, että jo 23 ihmisen joukosta löytyy samoja syntymäpäiviä 50%:n todennäköisyydellä. Toisaalta CSC:n 70:n ihmisen joukosta löytyy vain 17%:n todennäköisyydellä ihminen, jolla on sama syntymäpäivä kuin minulla.

Se että jotain tapahtuu juuri minulle on paljon epätodennäköisempää kuin että jotain tapahtuu jollekulle. Tarina "tutun tutulle" tapahtuneesta ihmeellisestä asiasta pitää siis tilastollisessa mielessä paikkansa. Ja jos kirjaamme ylös mitä tahansa yhteensattumia, löytyy niitä paljon enemmän kuin selvästi rajattuja tapahtumia. Onkin hyvin epätodennäköistä, ettei jotain ihmeellistä tapahdu jossain jollekulle. Tämän ymmärtääkseen tarvitsee vain mietiskellä maailman kuutta miljardia ihmistä: tästä joukosta löytyy kyllä mitä ihmeellisimpiä kohtaloita.

suomiengl/UKengl/USA10n, n SI-etuliite (etymologia)
tuhatthousandthousand3 = 1 x 3 kkilo(kr chilioi=1000)
miljoonamillionmillion6 = 2 x 3 Mmega(kr megas, iso)
miljardimilliardbillion9 = 3 x 3 Ggiga(kr gigas, jätti)
biljoonabilliontrillion12 = 4 x 3 Ttera(kr teras, hirviö; myös tetra = 4)
1000 bilj.1000 bill.quadrillion 15 = 5 x 3Ppeta(kr penta = 5)
triljoonatrillionkvintillion 18 = 6 x 3Eexa(kr hexa = 6)
1000 trilj.1000 trill.sextillion 21 = 7 x 3Zzetta(lt septem = 7)
kvadriljoonaquadrillionseptillion 24 = 8 x 3Yyotta(lt octo = 8)
1000 kvadr.1000 quadr.octillion 27 = 9 x 3
kvintiljoonaquintillionnonillion 30 = 10 x 3

Taulukko 1: Lukusanat eri maissa (lähde: Olli Serimaa, CSC)

Lisää aiheesta

Jack Cohen, Ian Stewart: That's amazing isn't it?, New Scientist, January 1998.

Juha Haataja: When We Are Lead Astray, CSC News, 3/1998.

L. Krauss: Fear of Physics: A Guide for the Perplexed, Basic Books, 1994.
Myös suomeksi: Oleta pyöreä lehmä, Art House, 1994.

Innumeracy: Mathematical Illiteracy and Its Consequences, Vintage Books, 1990.
Myös suomeksi: Numerotaidottomuus. Art House, 1991.

The Demon-Haunted World: Science as a Candle in the Dark, Ballantine Books, 1997.

Juha Haataja


Solmu 1/1999-2000
Viimeksi muutettu 31. maaliskuuta 2000.