Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Laadukkaat perustietovarannot ovat edellytys datatalouden etenemiselle

16.2.2021
Twitterissä: @AnttiJakobsson
Kuva: Pekka Jussila

Suomi on perinteisesti nähty perus­tieto­varantojensa osalta maailman huippu­maana – rekisterit ovat ajan tasalla ja laadukkaita. Silti Suomi sijoittui sijalle 28 eli neljän viimeisen joukkoon OECD:n tekemässä Euroopan hallintojen digitalisaatiovertailussa 2019. Sijoitus nostatti kohua, vaikka pienenä lohdutuksena olikin Ruotsin jääminen viimeiseksi.

En tässä lähde arvioimaan tuon selvityksen lukuja, mutta tuore selvitys perus­tieto­varantojen laadun nykytilasta nostaa esiin samoja asioita.

Valtiovarainministeriö on käynnistänyt Laatu­kehikko-­hankeen julkisten tieto­varantojen käytettävyyden parantamiseksi ja tieto­aineis­tojen yhteis­käytön helpottamiseksi. Sen tuloksena on määrä syntyä tieto­aineistojen laatu­kriteerit, jotka tähtäävät paremman laadun tuottamiseen.

Laatua voidaan lisätä yksinkertaisin keinoin

Hankkeen ensimmäinen etappi oli tuo alussa mainittu nykytilaselvitys. Siinä nousi esiin joukko parhaita käytäntöjä ja edellytyksiä laadun tekemiselle. Huomioitavia asioita ovat muun muassa tietoaineiston selkeä omistajuus, tiedon tuottajan eli operatiivisen järjestelmän merkitys sekä master datan käytön lisääminen.

Esimerkkejä parhaista käytännöistä ovat tikettijärjestelmän hyödyntäminen palautteen hallinnassa (Kuntatalouden tietopalvelu), automatisoidut tarkastukset tiedon vastaanotossa (Tulli, Tilastokeskus, Vero) ja niiden muuttaminen esitettävään muotoon (Maanmittauslaitos).

Master datan käyttö on parantanut esimerkiksi Kaupparekisterin laatua, kun ajoneuvorekisteri ryhtyi hakemaan sieltä yritysten osoitetietoja. Selvityksessä kävi myös ilmi, että laatu paranee, jos rekisterin pitäjä tiedon kokoamisen lisäksi itsekin käyttää tietoa.

Nämä ovat yksinkertaisia, mutta välttämättömiä asioita, joita ei vielä hyödynnetä kaikissa perustietovarannoissa. Sekä tiedon käyttö että sen avoimuus ovat omiaan lisäämään laatua. Perustietovaranto ei ole perustietovaranto ilman laajaa käyttöä!

Hankkeen myötä onkin tullut ilmi jonkinlaisen laatutestin tarpeellisuus. Sen avulla voisi tunnistaa parhaita käytäntöjä ja edesauttaa niiden leviämistä eri organi­saatioissa.

Kohti kokonaisvaltaista kehittämistä

Selvityksessä nousi esiin myös parannus­kohteita. Tiedon laatua kehitettäessä on huomioitava koko tiedonkäytön ekosysteemi – tiedon tuottaja, rekisterin­pitäjä ja käyttäjä. Esimerkiksi monessa perus­tieto­varannossa kunta on keskeinen tiedontuottaja, ja rekisterin­pitäjällä itsellään ei ole suoraan mahdollisuutta vaikuttaa kerättyjen tietojen laatuun.

Keskeinen haaste on myös se, jos kehittä­misestä aiheutuva hyöty ei konkretisoidu perus­tieto­varannon ylläpitäjälle itselleen. Silloin on vaikea perustella resursseja tieto­varannon sisällön tai laadun kehittämiseen.

Tiedon käyttäminen parantaa sen laatua. Niinpä mietintään pitäisikin ottaa tiedon käyttövelvoite, joka lisäisi perustietovarantojen käyttöä ja samalla parantaisi niiden laatua. My Data -periaatteen tuominen julkisiin tietovarantoihin voisi myös lisätä luottamusta viranomaisten toimintaan, parantaa mahdollisuuksia kerätä tarpeellisia tietoja ja lisätä niiden hyödyn­nettävyyttä.

Nykytilaselvitys ei vastaa kysymykseen, ovatko Suomen perus­tieto­varannot laadukkaita ja ajan­tasaisia. Sen sijaan hyvin toteutettuina laatu­kriteerit voivat kertoa perus­tieto­varantojen laadusta. Jos niille asetetaan myös tavoitteet, niillä voidaan saavuttaa tarvittava ohjaava vaikutus laadun parantamiseksi.

Mielestäni laatukriteereiden lisäksi tarvitaan edellä esitetty laatutesti, joka auttaa sparraamaan organisaatioita hyödyntämään tietoa ja kehittämään laatua.

Datatalous vaatii laadukkaita ja yhteen toimivia perustietovarantoja. Nyt tehty nyky­tila­selvitys osoitti, että kokonaiskuva ei ole täysin hallinnassa ja parhaat käytännöt voivat jäädä hyödyntämättä. Hanke on hyvä alku, mutta jatkossa kaikkien tieto­eko­systeemissä toimivien välille tarvitaan pitkäaikaista yhteis­työtä ja koordinointia.

Lue lisää tiedon laatukehikko -hankkeesta.

 

Kirjoittaja toimii yli-insinöörinä Maanmittaus­laitoksessa ja hänellä on pitkä kokemus paikkatietojen laadun kehittämisestä ja sen standardoimisesta.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
16.2.2024
Markus Sovala

Suomen tilastojärjestelmä ylsi ykkössijalle 186 valtiota kattaneessa vertailussa. Tilastokeskuksen pääjohtaja löytää kolme perustetta Suomen menestykselle Maailmanpankin arviossa.

Blogi
12.1.2023
Markus Sovala

Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tieto­varallisuus, joka on Suomen kilpailu­etu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.  

Blogi
29.9.2021
Mikko Lindholm

Alamme Suomessa lähestyä kriittistä pistettä, jossa datataloudesta tulee oikeasti merkittävää liiketoimintaa. Mikä sitten tekee menestyvän datapalvelun? Datamenestyjät -kilpailutöissä nousee esiin ainakin kaksi ominaisuutta: visualisointi ja oikeanlainen kysymyksen asettelu. 

Blogi
17.8.2021
Mikko Lindholm

Avoimen datan potentiaalia uuden digitalouden käyttövoimana ja mahdollistajana on vielä paljolti hyödyntämättä. Myös julkisten virastojen ja laitosten datapalveluiden on tulevaisuudessa oltava entistä ammattimaisempia. 

Blogi
28.4.2021
Hannele Orjala

Lapsia koskevaa tietoa on paljon, mutta usein koetaan, että se on sirpaleista ja hajallaan. Tätä puutetta Tilastokeskus paikkaa tuottamalla laajan Tieto&trendit -artikkelisarjan lasten maailmaa avaavista tilastotiedoista. Lapset Suomessa -artikkelisarja nostaa esille yhteiskunnallisesti merkittävän aiheen tuottamalla vuoden ajan analyysia lasten elinoloista noin 30 artikkelin välityksellä.

tk-icons