Vuoden data-avauksena palkittu paikkatietomuotoinen tilastodata syntyi käyttäjien toiveesta

HRI:n ohjausryhmä valitsi helmikuun kokouksessaan vuoden 2023 parhaaksi data-avaukseksi Helsingin kaupunkitietopalvelujen avaaman Aluesarjat-tilastotietokannan tiedot paikkatietona. Aineisto mahdollistaa Helsingin osa-alueittaisten tilastotietojen käytön avoimen WFS-rajapinnan kautta. Tilastot perustuvat Helsingin seudun aluesarjat -tilastokannassa oleviin tietoihin.

Data-avauksen takana ovat kaupunginkanslian kaupunkitietopalvelut-yksikössä tietopalveluiden ja raportoinnin kehittämisen parissa johtavana asiantuntijana työskentelevä Claudia Bergroth ja samassa yksikössä tutkijana työskentelevä Tea Tikkanen.

Ajatus paikkatietomuotoisesta datasta lähti käyttäjien palautteesta, ja inspiraationa toimi myös Tilastokeskuksen Paavo-tietokanta, postinumeroalueittain saatavilla oleva avoin data.

”Aluesarjojen tilastotietokannoista on helppo löytää tietoa valitusta teemasta eri alueilta, mutta saimme toiveita, että olisi hienoa, jos yhdeltä alueelta löytäisi tietoja eri teemoista. On esimerkiksi suunnittelijoita, jotka ovat aiemmin joutuneet itse muuntamaan poimimansa tilastotiedot paikkatietomuotoon, mutta nyt aineisto on valmiiksi sellaisessa muodossa, että sitä on helppo käyttää suoraan paikkatieto-ohjelmassa”, Claudia kertoo.

Kartalla esitetään 0-14-vuotiaiden osuus alueen väestösta vuonna 2021.

Kaupunkiympäristön toimiala tiiviisti mukana työssä

Paikkatietomuotoisen datan avaamista sujuvoitti se, että valmiina oli paljon elementtejä. Mitään uutta aineistohankintaa ei tarvinnut tehdä.

”Tarvittava data oli valmiina Aluesarjoissa, jossa tilastot ovat jo valmiina siinä muodossa, että niitä voi avoimesti jakaa. Tieto piti vain koostaa siihen muotoon, että se pystytään siirtämään prosessissa seuraavaan vaiheeseen. Kaupunkiympäristön toimiala oli merkittävässä roolissa: ilman heitä tätä aineistoa ei olisi syntynyt, koska heidän paikkatietoasiantuntijansa tekevät jatkossakin geokoodauksen ja huolehtivat aineiston jakelusta kaupungin paikkatiedon WFS-rajapintapalvelussa ”, Tea kiittelee.

Paikkatietomuodossa oleva data poikkeaa Aluesarjojen tilastotietokannasta siten, että paikkatieto on valmiina mukana ja tieto on käännetty alue edelle. Voisi sanoa, että paikkatietomuotoinen data ja Aluesarjat täydentävät toisiaan.

Kartalla esitetään Helsingin väkiluku osa-alueittain vuonna 2021.

Hyödyntämisessä rajattomasti mahdollisuuksia

QGIS-ohjelmalla on liitytty Helsingin avoimeen WFS-rajapintaan, ja etsitty aluesarjoja.
Esimerkiksi QGIS-ohjelmalla voi hyödyntää WFS-rajapintoja.

Uusi paikkatietomuotoinen aineisto sisältää Aluesarjat-tilastotietokannasta valittuja ja paljon käytettyjä tilastotietoja, kuten esimerkiksi alueen väestörakennetta ja väestömuutoksia, väestön koulutustasoa ja tulotietoja, työpaikkojen määrää tai asumiseen ja rakentamiseen liittyviä tietoja. Paikkatietomuotoista dataa päivitetään kerran vuodessa. Tällä hetkellä se sisältää vain Helsingin tilastoja. Tarkka kuvaus aineiston sisällöstä sekä muita lisätietoja löytyy HRI:n sivuilla julkaistusta kuvauksesta.

Paikkatietomuotoinen data on käytettävissä kaupungin avoimen WFS-rajapintapalvelun kautta, joten sitä voi hyödyntää erilaisissa paikkatieto-ohjelmissa ja paikkatietosovelluksissa. Datan käyttäminen vaatii, että osaa käyttää paikkatieto-ohjelmaa ja hyödyntää WFS-rajapintapalveluja sekä tietenkin sitä, että osaa käyttää omaan käyttötarkoitukseensa sopivaa tilastotietoa. HRI:n sivuilta löytyy ohjeita paikkatietorajapintojen käyttöön.

”Mahdollisuudet ovat rajattomat, sitä pystyy yhdistämään monenlaisiin erilaisiin aineistoihin”, sanoo Claudia.

Vuoden data-avauksen tehneet toivovat, että avattu data otetaan käyttöön – se on paras palkinto tehdystä työstä.