Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Valhe, emävalhe, tilasto – vanha vitsi murenee uusien aineistojen myötä

14.6.2019
Twitterissä: @MariYlaJarkko
Kuva: Kari Likonen

Otsikon tuttuakin tutumman vanhan väsyneen vitsin kuulee aina joskus, kun kertoo olevansa töissä Tilastokeskuksessa. Samaa vitsiä näkee väännettävän myös kommenteissa, kun lehdet uutisoivat asioista tilastoihin nojautuen.

Totta tarinan toinen puoli – mikäli käytettävissä oleva aineisto on vinoa, voi siitä tehtävät johtopäätöksetkin olla vääriä. Osa tilastoinnissa käytettävistä aineistoista on kokonaisaineistoja, jolloin tilasto on totuudenmukainen. Osassa taas aineisto kerätään, ja aineiston vinoumia joudutaan korjaamaan oikeiksi.

Tilastokeskus käyttää lähteenään pääsääntöisesti hallinnollisia aineistoja. Siis niitä, mitä kertyy muille viranomaisille heidän toimintansa yhteydessä. Hyvänä esimerkkinä käy verottajalle raportoitavat tiedot, joista saamme aikaan monta tilastoa: tulotilastot, palkkasummakuvaajat jne.

Loput tiedot keräämme suoraan sieltä, mistä ne luotettavimmin ja kattavimmin saamme. Tähän asti tietoja on kerätty suoraan yrityksiltä, esimerkiksi hinnat kaupan hyllyn reunalta, tai kansalaisilta, vaikkapa matkojen määrät ja kohteet.

Tiedonkeruut kuitenkin rasittavat tiedonantajaa, ja kansainvälisesti havaittu tosiasia on, että vastauskadot kasvavat. Sen seurauksena tilastojen luotettavuus heikkenee.  

Mutta onneksi tilanteeseen on tarjolla ratkaisuja.

Digitalisaation myötä yrityksille kertyy tietoa omasta ja asiakkaiden toiminnasta sähköisessä muodossa. Näistä muodostuu mm. big dataa, jonka hyödyntämisestä tilastoinnissa on puhuttu jo jonkin aikaa.

Hyvä esimerkki tällaisesta aineistosta ovat vaikkapa kassapääteaineistot. Kaupoilla on tiedossa, mitä tuotteita, kuinka paljon ja milloin asiakkaat ostavat. Tästä data-aineistosta voidaan tuottaa erittäin tarkkoja hintakehitystä kuvaavia tilastoja. Kun kaupan kanta-asiakastiedoista pystytään yhdistämään ostajatietoja, voidaan myös tuottaa nykyistä tarkempaa kulutusrakennetta kuvaavaa tietoa.

Big datan käyttö on ilmeisen yleistä jo yritystoiminnassa – Google kerää tietoa käyttäjiensä toimista ja osaa kohdentaa mainontaa tämän perusteella tai kertoa, millainen liikenne usein käytetyllä reitillä on juuri nyt.

Mutta tilastoinnin osalta big datan käytössä on vielä haasteita. Nykyinen tilastolaki sallii meidän kerätä tietoa yrityksiltä niiden omasta toiminnasta, mutta ei asiakkaiden toiminnasta. Voimme siis saada yrityksen palkkatiedot, mutta emme asiakkaiden ostotietoja.

Digitaalisia aineistoja on jo otettu onnistuneesti käyttöön. Hyvät esimerkit ovat vuosien takaa: kotimaiset yöpymiset perustuvat sähköisesti saatavaan aineistotoimitukseen, samoin palkkatiedot on poimittu jo pitkään ohjelmallisesti yritysten palkanlaskentajärjestelmistä.

Nämä tiedot ovatkin varsin kattavia, ja tietojen hankinta rasittaa vastaajia varsin vähän. Muutamalla napin painalluksella oikeat tiedot ovat Tilastokeskuksessa. Uusien aineistojen testaus ja käyttöönotto on meneillään, mutta se edellyttää sopimista jokaisen aineistotoimittajan kanssa.

Tilastolain uudistustyö on käynnissä. Toivomme sen tuovan yrityksille mahdollisuuden luovuttaa hallussaan olevia tietoja tilastointia varten. Näiden uusien aineistojen myötä Tilastokeskuksen aiheuttama rasitus niin yrityksille kuin kansalaisille pienenisi huomattavasti.

Samalla tilastojen laatu paranisi entisestään, ja kattavaan ja laadukkaaseen aineistoon nojaava tilastotieto tarjoaisi yhteiskunnallisen päätöksenteon perustaksi mahdollisimman totuudenmukaisen kuvan.

 

Kirjoittaja työskentelee tilastojohtajana Tilastokeskuksen yritystilastot-yksikössä.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
12.1.2023
Markus Sovala

Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tieto­varallisuus, joka on Suomen kilpailu­etu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.  

Blogi
1.12.2022
Markus Korhonen, Anna Mustonen

Ensi vuoden alussa toimintansa aloittavat hyvinvointialueet tuovat paitsi muutoksia kansantalouden tilinpidon tilastojulkaisuihin myös epävarmuutta muutosvaiheen tilastotietoihin. Ensimmäisen kerran uutta sektoriluokitusta käytetään kesäkuussa 2023 julkaistavassa Julkisyhteisöjen tulot ja menot neljännesvuosittain -tilastossa.

Blogi
24.10.2022
Jukka Hoffren

Demokratioissa tilastot ovat osa yhteiskunnallista keskustelua, päätöksentekoa sekä seurausten arviointia  ja puolueettomina ne luovat edellytyksiä kompromisseille. Tietoon perustuva päätöksenteko edellyttää hidasta, harkitsevaa ja kyseenalaistavaa ajattelua. Jotta demokratia säilyisi informaatioyhteiskunnan perustana, tulisi tilastojen luku- ja käyttötaidosta tehdä yleinen kansalaistaito.

Blogi
20.10.2022
Anna Pärnänen

Miten keskustelisimme nyt vaikkapa palkkojen ostovoimasta – eli inflaatiosta ja ansioiden kehityksestä – tai nuorten mielenterveysongelmista, jos mitään tilastotietoa yhteiskunnasta ei olisi olemassa? kysyy Anna Pärnänen Euroopan tilastopäivän blogissaan. 

Blogi
25.8.2022
Jukka Hoffren

Luotettavan ja nopean faktatiedon kysyntä kasvaa jatkuvasti. Säästöpaineissa tuskailevilla valtion­hallinnon organisaatioilla on kasvavia haasteita vastata tarpeisiin. Tietoaineistoa on saatavissa käyttöön valtavasti lisää kustannus­tehokkaasti hyödyntämällä laajemmin rekisteri­tietoja ja muita hallinnollisia tieto­aineistoja. Tämä edellyttää tieto- ja tilasto­ekosysteemin kehittämistä ja entistä syvempää verkostoitumista.

Blogi
1.7.2022
Sirkku Hiltunen

Suomi lukuina 2022 -julkaisujen kesä alkoi tänä vuonna vauhdikkaasti: uunituoreet taskutilastot olivat jo kesäkuun alussa mukana juhlistamassa Tutkitun tiedon teemavuotta Heurekassa. Taskuun menevään julkaisuun on jälleen kerran koottu mielenkiintoisia tilastolukuja – vanhimmat lähes 300 vuoden takaa. Lue blogista toimittajan poiminnat.

tk-icons