Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Tilastoista ihan kaikille ja kaikkialle

19.3.2024
Twitterissä: @JaanaHuhta
Kuva: istock

Meneillään olevan verkkouudistuksemme tavoitteena on tarjota tilastoja nykyaikaisemmassa ja helpommin löydettävässä muodossa erilaisille tilastonkäyttäjille. Tilastojen julkistamisen johtotähtenä on: data ensin. Teksti rakentaa tilastoille merkityksen. Jotta kaikki pääsevät yhtä vaivattomasti tilastojen äärelle, tulee kaikessa tilastokirjoittamisessa käyttää selkeää ja ymmärrettävää kieltä.

Ylpeilimme pitkään Tilastokeskuksessa, että olimme ensimmäisiä, ellemme peräti ensimmäinen tilastovirasto, joka meni nettiin. Mutta mitäpä sitä niin vanhoja muistelemaan. Tuon vuoden, 1995, jälkeen on vettä virrannut Vantaanjoessa niin vuolaasti, että parasta palata suoraan nykyaikaan.

Jatkuvan viestitulvan aikakaudella lyhytvideot, meemit ja kuvat syöpyvät suoraan verkkokalvoillemme, eikä kärsivällisyytemme kestä keskittymistä henkäystä pidempään. Nykyajan mediavirrassa voisi helposti uskoa väittämän, että teksti on kuollut. Lepää rauhassa. Tähän voisi siis lopettaa?

Ei sentään. Tekstiä tuottuu ja julkaistuu juuri nyt enemmän kuin koskaan. Varsinkin surkeaa sisältöä on tarjolla mitä moninaisimmissa muodoissaan: trollausta, väärinkirjoitettua vihapuhetta, automaattikäännettyä huijausyritystä.

Hyvällä tekstillä on nyt, jos koskaan, mahdollisuus erottautua, löytää maaliinsa ja vaikuttaa.

Internet synnytti tilastot

Tilastojen tarjoaminen verkossa on vaatinut paperisiin tilastolehtisiin verrattuna perustavanlaatuisia määrittelyjä ja läpikäyntejä. Oikeastaan vasta internet synnytti nykyisin tuntemamme kaltaiset eri tilastot aiheineen ja kuvauksineen.

Nettiaikojen alussa Tilastokeskuksessa tilastoista kirjoittivat lähinnä viestinnän ammattilaiset. Vuoden 2004 uudistuksessa vastuu tuoreen tilastotiedon tiedottamisesta siirtyi varsinaisille tilastoasiantuntijoille.

Nykyäänkin tilastoista kirjoittavat niitä laativat asiantuntijat aina uuden tiedon julkistamisen yhteydessä. Omia aineistoja on möyhinnän lisäksi pohdiskeltava, jotta niistä saa kiteytettyä tiedotteen Uusimmat tilastotiedot -kohtaan Tilastokeskuksen etusivulle.

Tilastoaineiston kaivelu on hyväksi tilaston laadulle. Ennen kirjoittamista, taulukoiden ja kuvioiden laadintaa on kysyttävä kysymyksiä datalta. Onko tieto oleellista? Millaisia tietokantataulukoita tästä aineistosta on järkevää tehdä? Onko tuossa kyseessä todellinen muutos vai kenties virhe?

 
Kuvassa kaksi nuorta katsovat yhdessä mobiilipuhelimia.
Tavoitteena on tarjota tilastoja nykyaikaisemmassa ja helpommin löydettävässä muodossa erilaisten käyttäjien, kuten nuorten, tarpeisiin. Kuva: iStock

Tilastokeskuksen verkkosivuja on uudistettu enemmän ja vähemmän läpi nettihistorian elinkaaren. Viimeisin suuri uudistus on edelleen meneillään. Yhtenä uudistuksen tavoitteena on tarjota tilastoja nykyaikaisemmassa ja helpommin löydettävässä muodossa erilaisten tilastonkäyttäjien tarpeisiin.

Data ensin ja äkkiä!

Tilastokeskuksen tilastojen julkistamisen johtotähtenä on: data ensin. Data ensin tarkoittaa sitä, että tilastotieto on julkista, kun se on julkaistu StatFin-tietokannassa. Tilastokeskus julkistaa arkipäivittäin tilastotietoa aamukahdeksalta kaikille käyttäjille yhtäaikaisesti. Emme luovuta tietoa kenellekään ennen tuota h-hetkeä.

Uusinta tilastotietoa julkistetaan tilaston yhden tai useamman tietokantataulukon kokonaisuuksina. Kokonaisuuden kaikki tiedot päivittyvät samaan aikaan ja samassa syklissä. Yksi tällainen kokonaisuus on vaikkapa kuluttajahintaindeksi kuukausittain ja toinen kuluttajahintaindeksi vuosittain.

Tietojen päivittyminen nostetaan esiin tiedotteella. Tekstissä tilastoasiantuntija raportoi tietokantataulukoiden pohjalta ytimekkäästi kehityksen suuntaa.

Tiedotteet ovat Tilastokeskuksen jokapäiväistä peruskauraa. Tiedotteen tietoja kuulet siteerattavan aamu-uutisissa ja sanomalehtien pääkirjoituksissa, joissa kerrotaan, kuinka ”Tilastokeskuksen mukaan” asioiden laita olikaan.

Data ensin tarkoittaa myös sitä, että julkaisemme uutta tietoa mahdollisimman nopeasti, emmekä käytä ensivaiheen analysointiin päiväkausia aikaa. Tilastoista kirjoitetaan myös syvällisempiä katsauksia sekä Tieto&trendit-verkkolehden asiantuntija-artikkeleita ja bloggauksia.

Internet on mullistanut tilastojen käytön tietopohjaisten tuotteiden raaka-aineena. Yhä useammin Tilastokeskuksen dataa noudetaan koneellisesti suoraan tietokantojemme avoimesta rajapinnasta. Yksi verkkouudistuksemme tavoite onkin tarjota eheää, luotettavasti päivittyvää ja kattavasti kuvattua raaka-ainetta jatkojalostusta varten.

Tilastokeskus rakentaa ja laajentaa omaa verkkopalveluaan säännöllisesti päivittyvistä tietokantataulukoista StatFinistä. Haluamme tarjota asiakkaillemme valmiiksi laskettuja ja poimittuja näkymiä tietokantataulukoista, jottei jokaisen tietoa etsivän tarvitse kalastaa erikseen vaikkapa kuolleisuus- ja eloonjäämislukuja iän ja sukupuolen mukaan tai väestöä 31.12. kunnittain. Kuinka moni kaduntallaaja tietää äkkiseltään esimerkiksi sen, miten työttömyysaste lasketaan?

Verkkouudistuksen edetessä sivuillemme koostetaan kattavammin myös indikaattoreita ja laajempia ilmiöitä kuvaavia tietoa. Indikaattoreista olemme julkaisseet muun muassa bruttokansantuotteen, inflaation ja työttömyysasteen.

Teksti rakentaa tilastoille merkityksen

Tilastoja tarvitaan kuvaamaan maailmaa yhteiskunnallisen päätöksenteon ja suunnittelun tukena ja taustatietona. Suuri osa tilastoista pohjautuu kansainväliseen lainsäädäntöön, kuten vaikkapa työvoimatutkimus, joka laaditaan EU-maissa samojen säädösten mukaisesti. Tällöin tilastot ovat vertailukelpoisia myös eri valtioiden välillä.

Tilastoja säilötään myös tulevaisuuden historiantutkijoiden käyttöön, jotta he voisivat aikanaan yrittää ymmärtää ja selittää mennyttä aikaa.

Data ensin -periaate ei tarkoita tekstin väheksymistä tai tavoitetta siirtyä pelkkien numeroiden suoltamiseen tilastokoneistosta. Tilastot on sidottava kontekstiin, olemassa oleviin ilmiöihin ja maailmaan oikeilla sanoilla ja merkityksillä. Tilastoilla ei olisi arvoa myöskään ilman vakiintuneita luokituksia ja käsitteitä, joiden määrittely on olennainen osa tilastojen laadintaa ja käyttöä.

Aineiston käsittelijänä ja tilastojen rakentamisen osaajana tilastoasiantuntijalla onkin aitiopaikkanäkymä siihen, mikä kulloinkin on relevanttia.

Toisaalta rooliin kuuluu se, että on ymmärrettävä tilastojen rajallisuus maailmanselittäjänä. Syvällinen tieto tilastoista tuo mukanaan sisäsyntyistä varovaisuutta niiden tulkintaan.

Tilastoista kirjoittaminen - tarinoita numeroista vai turinoita taulukoista?

Päivittäisten tiedotteiden tehtävänä on nostaa esiin tuoreimman tiedon keskeisin havainto tekstimuodossa ja höystää se kuvioilla ja taulukoilla. Tiedote voi olla kuukaudesta toiseen hyvinkin samanlainen rakenteeltaan: ”Inflaatio 3,0 % helmikuussa 2024”.  Lähinnä vain luvut elävät kuukaudesta toiseen.

Nopean tilastotuotannon tuoksinassa tiedotteiden ei ole tavoitteena lähteä huomiokilpailuun lukijoista muun median kanssa. Klikkiotsikoita ”Katso inflaation shokkitaulukko” -tyyliin ei tarjoilla.  

Virallinen tilastotoimi ei voi myöskään elollistaa kertomaansa tuomalla esiin yksittäisiä henkilöitä tilastojen valossa. Tilastojen laadinnassa noudatetaan tiukkaa tietosuojaa. Siksi Tilastokeskuksen etusivulla ei haastatella henkilöä, joka toteaisi konkreettisesti ruokakorin kallistumisen näkyvän arjessaan.

Taulukot ja tilastokuviot ovat olennaisia tilastotietojen jäsentäjiä ja esittäjiä. Moni lukija sisäistää yhdellä silmäyksellä kehityksen suunnan kuviosta, kun taas toisille jutun juuri lähtee versomaan vasta taulukkomuotoisesta esityksestä.

Tilastokeskus otti käyttöön huhtikuussa 2022 uudella tavalla tuotetut tilastokuviot ja -taulukot, jotka syntyvät kuin liukuhihnanäkyminä tietokantataulukoista. Kuvioissa on oikean yläkulman hampurilaisvalikon kautta pääsy kuvion lähdetietokantataulukkoon, ja kuvion datan voi ladata itselleen vaikkapa Exceliin.

Lisäksi kuvioissa ja taulukoissa voi olla mukana toiminnallisuuksia, kuten vuoden, alueen tai muun muuttujan vaihtomahdollisuus. Voit testata toimintoja ja kuvion tietojen avaamista tietokantataulukon muodossa esimerkiksi väestörakennetilaston kuvioissa.

Tällaisia kuvioita ja taulukoita käytetään tiettyä ajankohtaa kuvaavilla tiedotteilla kyseiseen viiteaikaan ”jäädytettyinä”, eli kuvioiden käppyrät eivät muutu, vaikka lähdetietokantataulukko saakin säännöllisesti uutta tietoa. Sen sijaan kunkin tilaston pääsivulla kuviot ja taulukot otsikoineen päivittyvät automaattisesti aina, kun tietokantataulukko päivittyy.

Tilastoista kirjoittaessa on helppo päätyä luetteloimaan tekstiin taulukon tai kuvion sisältöä. Lukijan kannalta on mielekkäämpää nostaa taulukosta ja kuvioista keskeisin havainto tekstiin ja luottaa siihen, että ajatuksella laaditut kuviot ja taulukot puhuvat puolestaan. Tilastotiedon visualisointi onkin oma lajinsa, josta kiinnostuneet voivat kurkata Tilastokuviot tutuksi -opasta.

Palautetta kuunnellen askelia kohti selkeyttä

Tilastokeskuksen verkkosivuja plärätessä havahtuu edelleenkin jopa paperimaailman havinaan. Kirjoitamme helposti liian pitkiä kappaleita, joita on mahdoton lukea tulitikkuaskin kokoiselta kännykän näytöltä. Usein käytämme liian koukeroisia ilmauksia ja sorrumme muunkinlaiseen laiskuuteen kielenkäytössä.

Aika- ja muiden määreiden runsaus kankeuttaa tilastokieltä kauttaaltaan. Vaikka määreitä pyrkisi vähentämään, on niitä jossain määrin oltava, jotta tekstin tarkkuus säilyisi. On olennaista tietää, puhutaanko kokonaisansioista vaiko säännöllisen työajan ansioista, kun mediaaneja vertaillaan.

Kaikessa tilastokirjoittamisessa on tavoitteena käyttää selkeää ja ymmärrettävää kieltä, jotta lukijan olisi helppo sisäistää tiedotteen keskeinen uutinen, vaikka aihe ja tilasto eivät olisikaan ennestään tuttuja. Ohjeistamme ja koulutamme kirjoittajia kohti parempaa ilmaisua. Lisäksi pyrimme käymään tekstejä ennalta läpi ihan tavallisia tilastonkäyttäjiä ajatellen.

Maailma ympärillämme on muuttunut nopeasti. Siirtyminen printistä verkkojulkistamiseen tarjosi ainakin teoreettisen mahdollisuuden lähes maailmanlaajuiseen tilastoyleisöön. Tilastokeskus julkaiseekin tietoja suomen kielen lisäksi ruotsiksi ja englanniksi.

Pohdimme ja kehitämme tilastoavaruuden jäsennystä ja ilmiasua jatkuvasti myös asiakaspalautetta kuunnellen. Meillä on lähes jokaisen verkkosivun alalaidassa mahdollisuus klikata Löysitkö mitä etsit? -painikkeita ja kertoa omin sanoin palautteeseen, mitä tietoa oli hakusessa ja millaisin lopputuloksin.

Tavoitteen tuleekin olla, että kaikki pääsevät vaivattomasti tilastojen äärelle. Tämä kunnianhimoinen päämäärä ei tällä hetkellä täysin toteudu. Osin voimme tarjota selitykseksi verkkouudistuksen ja sivuston hakutoiminnon keskeneräisyyttä.

Toisaalta maailman muutos on muuttanut ihmisiäkin, tilastojen käyttäjiä. Emme vielä täysin tiedä, minkälaisia tarpeita me yritämme täyttää. Olisiko tilausta esimerkiksi selkokielisille tilastokoosteille? Entä miten kiteyttää entistäkin iskevämmin olennainen tieto lukijalle, joka ei viihdy saman asian äärellä muutamaa sekuntia pidempään?

Mikään kehitysprojekti, saati artikkeli, ei voi olla vuonna 2024 ottamatta kantaa tekoälyn hyödyntämiseen. Tekoälyn voi odottaa sujuvoittavan hyvinkin pian useita tilastojen julkistamisen vaiheita, vähintäänkin kielen selkeyttämistä ja -huoltoa.

Tekoäly tulee varmasti tulevaisuudessa operoimaan kaikissa tilastoprosessin vaiheissa.  Eli voidaanko todeta, että ilmeisen pian koko tilastokirjoittaminen on kuollut? Lepää rauhassa.

Ei sentään. Totean lopuksi vankasti asiaani uskoen: ihmislähtöistä, hyvää tekstiä tilastoista tullaan tarvitsemaan aina!

Kirjoittaja työskentelee yliaktuaarina Tilastokeskuksen verkkotoimituksessa.

Lue samasta aiheesta:

Blogi
16.2.2024
Markus Sovala

Suomen tilastojärjestelmä ylsi ykkössijalle 186 valtiota kattaneessa vertailussa. Tilastokeskuksen pääjohtaja löytää kolme perustetta Suomen menestykselle Maailmanpankin arviossa.

Blogi
1.9.2023
Maija Metsä

Kesälomani lopulla seurasin sivusilmällä lukiolaisnuoren pakkausruljanssia. Edessä oli vaihto-oppilasvuosi ja lähtöön muutama päivä. Mahtuisiko matkaan myös taskullinen tietoa Suomesta?

Blogi
2.5.2023
Tapio Kuusisto

Talouden keskeiset mittarit näyttävät isoja ja risti­riitaisiltakin vaikuttavia muutoksia. Tilastojen päälinja lienee oikea, mutta lukuihin voi laskennan tarkentuessa tulla revisioitakin, kun talouden rakenteessa on tapahtunut muutoksia. Tarkentumisten suuntaa ei pysty ennakoimaan, se vaihtelee eri vuosien välillä.  

Blogi
12.1.2023
Markus Sovala

Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tieto­varallisuus, joka on Suomen kilpailu­etu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.  

Blogi
24.10.2022
Jukka Hoffren

Demokratioissa tilastot ovat osa yhteiskunnallista keskustelua, päätöksentekoa sekä seurausten arviointia  ja puolueettomina ne luovat edellytyksiä kompromisseille. Tietoon perustuva päätöksenteko edellyttää hidasta, harkitsevaa ja kyseenalaistavaa ajattelua. Jotta demokratia säilyisi informaatioyhteiskunnan perustana, tulisi tilastojen luku- ja käyttötaidosta tehdä yleinen kansalaistaito.

tk-icons