Kolmekymmentä vuotta sitten, kaukaisella Australian Sunshine Coastilla, Les Stewart päätti ryhtyä ainutlaatuiseen ja monien mielestä mahdottomaan tehtävään. Hänelle oli kerrottu, että nähdäkseen nimensä Guinnessin ennätystenkirjassa, hänen olisi tehtävä jotain todella poikkeuksellista. Hänen pitäisi kirjoittaa kaikki numerot yhdestä miljoonaan sanoilla, ei numeroilla, käyttäen kirjoituskonetta.

Jälkeen päin, tämä herättää monta kysymystä - ennen kaikkea kuinka monta kirjainta tarvittaisiin, jos sama tehtävä suoritettaisiin suomen kielellä? Entä kuinka paljon aikaa urakkaan menisi kokonaisuudessaan vuorokausissa kohtuullisella kirjoitusnopeudella varustetulla henkilöllä? Kuinka paljon pitäisi varata aikaa päivittäin, jotta työn saisi tehtyä tietokoneella kirjoittaen?

Tässä artikkelissa sukellamme selvittämään asiaa ChatGPT:n ja Noteable pluginin avulla.

Numeroiden sanallinen esitys ja kirjainten laskeminen

Suomen kieli on tunnettu monimutkaisista sanoistaan ja taivutusmuodoistaan. Tämä pätee jossain määrin myös numeroiden sanallisiin esityksiin. Katsotaanpa, kuinka numerot esitetään sanoilla ja kuinka niiden kirjainten määrä lasketaan.

  1. Yksinkertaiset numerot (1-19): Nämä ovat perusnumeroita, joita käytetään muiden numeroiden muodostamiseen. Esimerkiksi 'kolmetoista' koostuu 'kolme' ja 'toista'. Jokaisella näistä numeroista on oma sanallinen esityksensä, ja niiden kirjainten määrä vaihtelee.
  2. Kymmenluvut (20, 30, ... 90): Kymmenluvut muodostetaan lisäämällä pohjanumeroon '-kymmentä'. Esimerkiksi 50 on 'viisikymmentä'.
  3. Suuremmat numerot (sata, tuhat, kymmenentuhatta jne.): Suurempien numeroiden sanalliset esitykset muodostuvat yhdistämällä pienempiä numeroita. Esimerkiksi 125 on 'satakaksikymmentäviisi'.
  4. Taivutusmuodot: Suomen kieli on tunnettu monimutkaisista taivutusmuodoista. Numeroiden kanssa selvitään kuitenkin kohtalaisen helposti. Ensimmäinen kertaluku kymmenien jälkeen ilmoitetaan aina ilman ykköstä, esim. “sata”, “tuhat”, “miljoona”. Monikerrassa lisätään pohjanumero, sekä kertaluku päätteellä “-a” - poikkeuksena “tuhat”, johon lisätään “-ta”. Esimerkiksi: “kaksi sataa”, “kolme tuhatta”, “viisi miljoonaa”.
  5. Laskentafunktiot:
    1. Käytämme funktiota, joka ottaa numeron syötteenä ja palauttaa sen sanallisen esityksen. Tämä funktio käyttää yllä mainittuja sääntöjä numeroiden muuntamiseen sanoiksi.
    2. Toinen funktio laskee kirjainten määrän jokaisessa sanallisessa esityksessä. Ohjelmointikielissä tälle löytyy yleensä natiivifunktio eli operaatio on yksinkertainen. Otamme mukaan myös sanojen välilyönnit, koska niiden kirjoittamiseen menevä aika on huomattava. Ilman välilyöntejä olisi myös todella haastavaa lukea ja varmistaa, onko sana kirjoitettu oikein.
    3. Kolmas funktio arvioi kirjoittamiseen kuluvaa aikaa eri menetelmin.

Tämän prosessin avulla voimme laskea tarkasti, kuinka monta kirjainta tarvitaan kirjoittamaan jokainen numero sanoina suomen kielellä.

Tulokset

Käytimme laskentaan siis funktiota, joka ottaa numeron syötteenä ja palauttaa sen sanallisen esityksen. Tämä funktio käyttää suomen kielen sääntöjä numeroiden muuntamiseen sanoiks. Tämän avulla voimme laskea tarkasti, kuinka monta kirjainta tarvitaan kirjoittamaan jokainen numero sanoina.

  1. Tulokset: Tarvitaan yhteensä 62,224,010 kirjainta kirjoittamaan numerot yhdestä miljoonaan suomen kielellä. Näistä välilyöntejä olisi 997,002 kappaletta. Tämä kuvaa myös sitä, kuinka monta erillistä numerosanaa esiintyy joukossa. Englannin kieliset vastineet ovat 60,313,716 kirjainta ja 7,459,903 välilyöntiä/sanaa. Lisäksi jokainen luku täytyisi erottaa toisistaan jollain merkillä, esimerkiksi rivinvaihdolla, puolipisteellä ja/tai välilyönnillä, joista tulisi 1-2 miljoonaa lisämerkkiä. Näitä lisämerkkejä ei huomioida seuraavissa laskuissa!
  2. Päivittäinen kirjainten määrä: Verrattuna Les Stewartin saavutukseen, joka käytti Guinessin ennätykseen aikaa 16 vuotta ja 7 kuukautta, hänen olisi tarvinnut kirjoittaa keskimäärin 10,284 kirjainta päivässä saavuttaakseen saman tuloksen Suomen kielellä. Englannin kielellä sanat ovat keskimäärin lyhyempiä, mutta toisaalta välilyöntejä on enemmän. Alkuperäisessä tehtävässään Englannin kielellä hänen on täytynyt kirjoittaa noin 9,969 kirjainta päivässä.
  3. Vertailu: Suomen kieli on tunnettu monimutkaisista sanoistaan. On mielenkiintoista verrata, kuinka se suhtautuu muihin kieliin samassa tehtävässä. Erot vaihtelevat johtuen numerosanojen pituuksista ja niihin liittyvistä yhdyssanasäännöistä ja sanojen taivutuksista.

Esimerkiksi saksaksi tarvittaisiin 50,932,012 kirjainta kirjoittamaan numerot yhdestä miljoonaan. Tämä on noin 18% vähemmän kuin Suomen kielellä. Saksan kielellä numerosanoja ei erotella toisistaan välilyönneillä. Ruotsin kielellä vastaava suhde on jopa 38%. Jos välilyönnit otettaisiin pois, niin kirjaimia tarvitsisi kirjoittaa “vain” 37,515,008. Tämä tarkoittaa huomattavaa, jopa 40% säästöä. Englannin kielellä ero Suomeen on vain 3%. Johtuen englanninkielen välilyöntien suuresta määrästä, ero on marginaalinen.

Kirjoitusnopeudesta

Kun puhumme numeroiden kirjoittamisesta sanoina, joudumme huomioimaan, kuinka kauan tällainen tehtävä voisi kestää eri kirjoitusnopeuksilla. Kun suhteutamme Les Stewartin saavutuksen erilaisiin kirjoitusnopeuksiin, saamme käsityksen sen todellisesta laajuudesta.

  1. Eri kirjoitusnopeudet: Keskiverto ihminen kirjoittaa tietokoneella noin 40-70 sanaa minuutissa. Vanhanaikaista kirjoituskonetta käyttävät nopeat kirjoittajat voivat saavuttaa nopeuksia jopa 60-80 sanaa minuutissa, kun taas pikakirjoittajat voivat kirjoittaa jopa 150 sanaa minuutissa tietokoneella. Sanellen tehtävä olisi kaikkein nopein, sillä ihminen on paljon nopeampi puhumaan kuin kirjoittamaan. Puheentunnistus ei välttämättä kuitenkaan ole täydellistä, joten korjauksia täytyisi tehdä. Mutta näin toisaalta tapahtuu myös koneella kirjoittaessa.
  2. Esimerkkiaika: Ottaen huomioon edellä mainitut kirjoitusnopeudet, voimme laskea, kuinka kauan kestäisi kirjoittaa 62,224,010 kirjainta. Jos sanan pituus on keskimäärin 5.2 suomen kielessä ja kirjoitusnopeus on 70 sanaa minuutissa, niin keskiverto tietokonekirjoittajalle työ kestäisi noin 2849 tuntia tai 199 päivää (24 tuntista päivää).