Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Avoin data – harrastetoiminnasta julkiseksi palveluksi

17.8.2021
Twitterissä: @LindholmMikko
Kuva: Eeva Anundi

Data on uusi öljy, sanotaan. Se ei tarkoita vain sitä, että data on arvokasta ja sen omistajuudesta taistellaan. Data on myös yhteiskunnan käyttövoima ja voitelija. Kaikki toiminta yhteiskunnassa kuluttaa ja tuottaa dataa, ja kaikenlaista toimintaa voidaan myös sujuvoittaa datan avulla.

Esimerkiksi verkkokauppaostoksessa käytetään kauppiaan tuoteluetteloa ja ostajan käyttäjäprofiilia sekä tuotetaan uutta ostotapahtumatietoa. Tilaamista voidaan sujuvoittaa vaikkapa tunnistamalla asiakkaan sijainti ja listaamalla lähellä olevat toimituspisteet. Logistiikkaakin optimoidaan datalla. 

Dataan perustuvat toimintamallit ovat jo niin yleisiä, että yhteiskuntamme ei toimi enää ilman jatkuvia datavirtoja. Ja vauhti vain kiihtyy. Tiedolla johtamisen filosofia on sisäistetty niin yritysten kuin julkishallinnonkin johdossa. Päätöksentekijät kaipaavat yhä enemmän dataa, yhä useammista aihealueista ja yhä nopeammalla syklillä. Dataa tuottavat organisaatiot, kuten Tilastokeskus, ovat helisemässä uusien vaatimusten paineissa. Maailma vaatii polttoainetta, muuten pyörät pysähtyvät. 

Kun aloittelin työuraani ohjelmistokehittäjänä 198090-lukujen vaihteessa, työtäni rajoitti käyttökelpoisen datan puute. Tein kartta- ja tilastografiikkasovelluksia, mutta oli erittäin vaikeaa löytää käyttökelpoista dataa edes testaustarkoituksiin. Kaikki tieto oli suljetuissa järjestelmissä, eksoottisissa tiedostomuodoissa. Jos jotain oli saatavilla, se oli hyvin kallista. Digitaalinen talous kehittyi kovin hitaasti. 

Nykyisin tilanne on parempi. Lähes kaikki julkishallinnon organisaatiot julkaisevat avointa dataa sivuillaan. Kansainväliset organisaatiot, kuten OECD tai Maailmanpankki, tarjoavat paljon dataa. Myös useat kaupalliset toimijat, kuten pörssit, tuovat tapahtumadataa saataville API-rajapinnan kautta. Monelle yritykselle data on kuitenkin kriittinen kilpailutekijä, joten ne eivät edelleenkään ole halukkaita julkaisemaan dataansa muille.  

Lisääntynyt datan määrä tuo uusia haasteita. Yksi merkittävä ongelma avoimesti saatavilla olevissa datoissa on niiden yhteensopivuus. Jokainen toimija julkaisee dataa omista lähtökohdistaan ja itselleen sopivilla käytännöillä. Näin ollen tietojoukkojen kattavuus, tietomallien yhteensopivuus sekä ajallinen tai aggregointitason yhteensopivuus voivat olla heikkoja.

Tiedostoformaattiongelmista on onneksi jo enimmäkseen päästy. Jonkinlaista kehikkoa tai kokonaisarkkitehtuuria kuitenkin kaivattaisiin, jotta dataa yhdistelevät palvelut voivat järkevästi toimia.  

Datatalouden toimijoiden uskottavuus edellyttää myös datalähteiden julkistamista. Tarvitaan avoimesti tietoa siitä, mitä datajoukkoa käytetään, kuka datan on tuottanut, ja koska se on ladattu tai luettu rajapinnasta. Erityisen tärkeää tämä on siinä vaiheessa, kun aletaan yhdistelemään datoja eri tiedontuottajilta. Käytetyn tiedon laatu ja luotettavuus on kyettävä osoittamaan selkeästi ja siten, että kuka tahansa kuluttaja sen ymmärtää. Lopputulos voi olla vain niin hyvä kuin huonoin käytetty data.

Haasteista huolimatta avoimen datan palveluista on muotoutumassa vähitellen uutta digitaalista julkista infrastruktuuria valmiiden asiointi- ja tiedotuspalveluiden rinnalle. Mitä enemmän ja parempilaatuista dataa on saatavilla, sitä parempia palveluita niiden varaan voidaan rakentaa.

Olemme vasta kehityksen alkutaipaleella, mutta esimerkiksi Sovellukset - avoindata.fi sivusto tarjoaa jo esimerkkejä siitä, mikä on mahdollista. Avoimen datan potentiaalia uuden digitalouden käyttövoimana ja mahdollistajana on kuitenkin vielä paljolti hyödyntämättä. Tulevaisuudessa datapalveluiden on oltava entistä ammattimaisempia, ja niiden tulee nousta virastojen ja laitosten muiden toimintojen rinnalle olennaiseksi osaksi toimintaa. 

 

Kirjoittaja työskentelee Kehittäminen ja digitalisaatio -palvelualueen ylijohtajana Tilastokeskuksessa. Hän käsittelee blogisarjassaan datan olemusta ja merkitystä nyky-yhteiskunnassa.

Tilaa Tieto&trendit-juttukooste sähköpostiisi

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
10.3.2021
Ville Vertanen

Kun halutaan lisätä laadukkaan tilastotiedon käyttöä yhteiskunnassa, tulee tiedon löytämisen olla helppoa. Tilastotoimijoiden kunnianhimoisena tavoitteena on yhden luukun periaate, jossa kaikki virallinen tilastotieto löytyy samasta paikasta.

tk-icons