Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Haravoimalla uutta tietoa vuokra­mökeistä

3.7.2020
Kuva: Kari Likonen

Verkkoharavointi (eng. web-scraping) tarkoittaa tietojen automatisoitua keruuta internet-sivuston lähdekoodista. Verkko­haravointi on ollut jo pitkään mahdollista useilla eri koodikielillä, mutta vasta viime vuosina eri maissa on tunnistettu haravoinnin mahdollisuudet tilasto­tuotannossa.

Myös Tilastokeskuksessa on selvitetty verkko­haravoinnin mahdollisuuksia tiedon­hankinnassa. Käytännössä kaikki verkossa oleva tieto on mahdollista kerätä tilastojen tuotantoon, kunhan tiedon keräämisessä noudatetaan laillisia sekä eettisiä toiminta­periaatteita.

Verkkoharavoinnilla voidaan kerätä uutta tietoa kokonaan uusien tilastojen tuottamiseen tai nykyisten laadun parantamiseen. Lisäksi voi olla mahdollista korvata vanhoja haastatteluihin perustuvia tiedonkeruita, mikä vähentää vastaus­rasitetta eli yritysten ja yksityis­henkilöiden tiedon­keruisiin käyttämää aikaa.

Yksityishenkilöiden omistamat vuokra­mökit saadaan mukaan

Tilastokeskuksen majoitustilasto tuottaa laadukasta tietoa yöpymisistä yli 20 vuodepaikan majoitus­liikkeistä. Tiedolla pystytään arvioimaan sekä ulkomaalaisten matkailua Suomeen sekä suomalaisten kotimaan matkailua.

Matkailutilastoissa on kuitenkin ongelmana koko Suomen majoitus­kapasiteetin tunnistaminen, koska iso osa Suomen kapasiteetista on yksityisten henkilöiden omistamissa vuokra­mökeissä ja loma-asunnoissa.

Vuokramökkien majoitus­kapasiteetin tilastointi on aikaisemmin ollut mahdotonta, koska kapasiteettia ei ole laskettavissa viran­omaisten rekistereistä eikä haastattelu­tutkimuksen luominen vuokra­mökkien omistajille ole käytännössä mahdollista kohtuullisilla kustannuksilla.

Visit Finland ja Tilastokeskus aloittivat esiselvityksen vuokramökki­tilastoinnin perustamisesta vuoden 2018 alussa, jonka aikana luotiin menetelmä vuokra­mökkien tilastoimiseksi. Menetelmän keskeisenä osana on kapasiteetin tunnistaminen haravoimalla vuokra­mökkejä välittäviä sivuja. Haravoidut tiedot yhdistetään vuokra­mökkien välitys­palveluilta saatavaan käyttö­tietoon.

Vuokramökkitilaston verkko­haravoinnissa on tunnistettu yhteensä yli 11 000 vuokralla olevaa mökkiä. Esimerkiksi huhtikuussa 2020 suurimmilla kotimaisilla sivustoilla oli tarjolla 11 338 vuokra­mökkiä ja vuokrattavaa loma-asuntoa.

Vuonna 2019 vuokramökeissä oli yhteensä noin 2,68 miljoonaa yöpymistä. Tämä vastaa noin kymmentä prosenttia majoitus­liikkeissä tapahtuneista yöpymisistä.

Vuokramökkien keskihinnat ovat tilaston mukaan 43,31–144,98 euroa yöltä riippuen kuukaudesta. Tarkempia tietoa voi katsoa tilaston kotisivulta: http://www.stat.fi/tup/kokeelliset-tilastot/vuokramokkitilasto/index.html.

Haasteina ulkomaiset alusta­palvelut ja tupla­havainnot

Tällä hetkellä tiedonkeruu käsittää suurimmat kotimaiset vuokra­mökkien kauppa­paikat ja välitys­palvelut. Tiedonkeruu kattaa suurimman osan Suomen vuokra­mökeistä. Toistaiseksi ulkomaiset alusta­palvelut, kuten Airbnb, kuitenkin puuttuvat.

Kansainväliset sivut ovat vaikeampia haravoida, ja lisäksi niiden kanssa on vaikeampi sopia haravoinnin teknisistä yksityis­kohdista. Tilasto kattaa kuitenkin myös ison osan Airbnb:ssä olevista vuokra­mökeistä, koska useimmat kohteet on ilmoitettu myös kotimaisilla alustoilla.

Suurena haasteena tilastoinnissa on tupla­havaintojen tunnistaminen eli jos sama mökki on ilmoitettu kahdella tai useammalla eri sivustolla. Toistaiseksi Tilasto­keskuksessa on käytetty ilmoitus­tekstiin perustuvaa tunnistusta. Muita vaihtoehtoja on muun muassa kuvantunnistus­menetelmät.

Tämän tyylisissä haasteissa on tilasto­viranomaisilla mahdollista ottaa käyttöön koneoppimis­menetelmiä, jotka tekevät myös vahvasti tuloaan Tilasto­keskuksessa.

 

Kirjoittaja työskentelee yliaktuaarina Tilasto­­keskuksen matkailu- ja liikenne­­tilastoissa.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Artikkeli
29.6.2021
Ossi Nurmi

Kansainvälisten alustojen kautta majoitusvarauksia tekevät enimmäkseen ulkomaiset matkailijat. Suurin ulkomaisten osuus oli Helsingissä, 83 prosenttia yöpymisistä. Lähes joka neljäs alustojen kautta varatuista ulkomaisista yöpymisistä kirjattiin venäläisille, kertovat Eurostatin ensimmäistä kertaa julkaisemat tiedot alustojen kautta tehdyistä varauksista.

Artikkeli
16.4.2021
Kimmo Haapakangas, Salla-Tuulia Tuominiemi

Kuinka monta tuomiota Suomessa annettiin taskuvarkaudesta vuonna 2019? Entä myymälävarkaudesta? Tietoja on aiemmin ollut saatavilla vain joiltain osin rikosilmoitusten ja syylliseksi epäiltyjen osalta. Nyt Tilastokeskuksessa on kokeiltu koneoppimista varkausrikosten luokittelemisessa. Tuloksissa yllättää ainakin polttoainevarkauksien suuri määrä.

Artikkeli
15.12.2020
Ossi Nurmi

Koronakriisin myötä alan odotukset kohdistuvat nyt kotimaan vapaa-ajanmatkailuun. Heinäkuusta alkaen se on keskittynyt sellaisiin kohteisiin ja alueisiin, joissa turvavälejä on helpompi noudattaa. Vuokramökeissä rikottiin kesällä ennätyksiä – suurten kaupunkien hotellit ovat vaikeuksissa työmatkalaisten ja ulkomaalaisturistien puuttuessa.

Blogi
17.4.2018
Hanna Sutela

The platform economy, also known as the sharing economy, is a new kind of economic activity. There an enterprise offers digital market­places to other actors by means of which they can create something that produces value added.

tk-icons