Pääkaupunkiseudun avoin paikkatieto

Helsingin seudun ympäristöpalvelut HSY julkaisi tiedot pääkaupunkiseudun asukkaista ja rakennuskannasta avoimena datana.

HSY:n avoimen datan palvelun etusivu.
HSY:n avoimen datan sivut.

Pääkaupunkiseudun kuntien seudullista perusrekisteriä ylläpitävä HSY tarjoilee nykyisin data-aineistojaan virkamiesten lisäksi kaikkien kansalaisten hyödynnettäväksi. Tietoa ovat hyödyntäneet esimerkiksi yliopisto-opiskelijat harjoitustöissään.

HSY:n avoin data

www.hsy.fi/avoindata

HSY:n avoin data sisältää kolme vuosittain päivitettävää aineistoa: rakennustietoruudukko, väestötietoruudukko ja seudullinen rakennusmaavaranto. Aineistot kattavat pääkaupunkiseudun kunnat. Ruudukkoaineistojen ruudut ovat kooltaan 500 x 500 metriä. Paikkatietoaineistot voi ladata ilmaiseksi MapInfo (tab ja mif/mid) ja Esri shape -muodoissa. Seudullisen rakennusmaavaranto-datan voi ladata myös kml-muodossa.

Odotukset data-avaukselle

”Odotuksena on, että tutkijat saavat helpommin sopivia aineistoja käyttöön ja aineistokyselyt meille vähenevät.”

Kustannukset

”70 työpäivää.”

Mitä tapahtui, kun data avattiin

”Kesäkuussa kun katsoin, sivuilla oli yli 2500 käyntiä.”

Vinkit perässä tuleville

  1. ”Aloita pienestä, ei saa ahnehtia liikaa.”
  2. Pyri kartoittamaan datan käyttäjien toiveita etukäteen. Mene mukaan sovelluskehittäjien tapaamisiin.”
  3. ”Ole hereillä sosiaalisessa mediassa. Seuraa palautteita ja keskustelua. Liityin Twitteriin seuratakseni avoimen datan aiheita. Se on Facebookiakin aktiivisempi kanava, open data -hashtagilla löytyy paljon keskustelua.”

Projektin vetäjät

Suvi Uotila ja Henna-Kaisa Räsänen.
Suvi Uotila ja Henna-Kaisa Räsänen.

Suvi Uotila ja Henna-Kaisa Räsänen, HSY:n paikkatietoasiantuntijat

Milloin kuulitte ensimmästä kertaa avoimesta datasta?

”Opiskeluaikana 2000-luvun puolivälissä haaveilimme avoimesta paikkatiedosta. Koska sitä ei ollut, jouduimme keksimään harjoitustöissä käytettävän datan itse.”

Suosikkipalvelu, joka hyödyntää avointa dataa?

Reittioppaat, omassa Android-puhelimessa pyörii Andropas. ”Viinikoodi-sovellus on myös on hauska.”

Mitä dataa toivoisitte avattavaksi?

Kuntien tarkkoja kantakarttoja, joita käytetään kaavoituksen pohjana. ”Se hyödyttäisi oikeasti koko yhteiskuntaa.”

Miksi datan avaaminen on tärkeää?

”Opiskelu ja tutkimus saa aineistoa käyttöönsä, kansalaiset uutta tietoa ympäristöstään.”

Missä dataa käytetään?

Asuinalueiden ikä -visualisointi.
Asuinalueiden ikä -visualisointi.

Asuinalueiden ikä -visualisointi

Louhos-blogin kirjoittajat analysoivat HSY:n avointa dataa erilaisilla louhinta- ja visualisointityökaluilla. Esimerkiksi asuinalueen vanhimman rakennuksen rakennusvuosi kertoo karkeasti kaupunginosien ikäjakauman.

Maantieteen opiskelijoiden harjoitustyöt

Keväällä 2012 järjestetty harjoituskurssi Helsingin yliopiston geoinformatiikan laitoksella visualisoi ja analysoi HSY:n julkaisemaa avointa dataa.

Näin data avattiin

Syksy 2009: Ensimmäinen ajatus datan avaamisesta. 2010: HRI käynnistyy, sen vetäjät kannustavat HSY:tä datan avaamiseen. Kevät 2011: Säännölliset tapaamiset HRI:n kanssa alkavat. Syksy 2011: Suunnittelu etenee data-avauksen käytännön yksityiskohtiin. Joulukuu 2011: Ensimmäiset datat julki. Tammikuu 2012: Tarjonta laajenee vanhemmilla aikasarjoilla. Dataa käytetään Helsingin yliopiston paikkatietokurssilla.

Datan avaaminen: työlästä, mutta palkitsevaa

HSY:n paikkatietoasiantuntija Suvi Uotila napauttaa hiirellä 500 x 500 metrin kokoista ruutua jossakin Espoon ja Vantaan rajalla. Mapinfon ikkunaan avautuu hengästyttävä määrä numerotietoa. ”Ruudussa on vain 16 asukasta. Tietosuojasyistä emme voi näyttää, mihin ikäryhmiin he kuuluvat”, Uotila selvittää. Uotila kertoo, että hänen opiskellessaan 2000-luvun puolivälissä tästä vain haaveiltiin. ”Jouduimme itse keksimään datat, joilla harjoitustyöt tehtiin. Avointa paikkatietoa ei ollut olemassa.”

Nyt on. Uotilan kollega Henna-Kaisa Räsänen esittelee Helsingin yliopiston opiskelijoiden analyysejä kevään harjoituskursseilta. Maantieteilijät penkoivat HSY:n avaamaa dataa. Visualisoinnit vastaavat moniin kysymyksiin. Mihin nuoret aikuiset muuttavat pääkaupunkiseudulla? Miten se vaikuttaa asuntojen hintoihin? Missä asutaan väljästi, missä ahtaasti? Missä piilevät Helsingin seudun rakentamattomat tontit? Asiantuntijoiden käsissä loputon numeromassa muuttuu arvokkaaksi tiedoksi.

Perusrekisterin tietoa kaikille

Kuvankaappaus HSY verkkosivuista.
Helsingin seudun ympäristöpalvelut on kuntayhtymä, joka tuottaa ympäristöpalveluita Helsingin seudun asukkaille ja yrityksille. Vesi- ja jätehuollon lisäksi HSY vastaa seudullisista tietopalveluista.

HSY pitää yllä pääkaupunkiseudun kuntien seudullista perusrekisteri SePeä. Kahden viikon välein päivittyvä paikkatietoaineisto palvelee seudun suunnittelijoita ja tutkijoita. Kun pari vuotta sitten käynnistyneen HRI-hankkeen vetäjät ehdottivat tietojen avaamista kaikille halukkaille, Uotila ja Räsänen olivat innolla mukana. ”Meillä on ollut koko ajan halu palvella laajempaakin yleisöä. Mutta teemme töitä kunnille, emme voi jakaa heidän dataansa eteenpäin ilman kuntien lupaa.” Onneksi myös kunnat innostuivat hankkeesta.

Liian tarkkaa dataa

Kun ensimmäinen datajulkaisu saatiin tehtyä 2011 joulukuussa, oli jo opittu paljon. Itse julkaisu on vain jäävuoren huippu. Ensimmäinen ongelma oli, että HSY:n tieto on liian tarkkaa: rekisterissä on tieto esimerkiksi joka ainoasta pääkaupunkiseudun rakennuksesta. Tietosuojan turvaamiseksi koneluettavaksi tarkoitettu avoin data yleistettiin puolen kilometrin ruuduiksi, rakennusmaavaranto kaupunginosittain. ”Pitkiä päiviä vietetty tämän asian parissa. Mutta se on ollut kivaa tekemistä, ilman pakollista deadlinea. Töitä on saanut tehdä ilman stressiä”, Suvi Uotila kertoo.

Työläs vaihe oli myös tiedon dokumentointi. Avoimen datan sisällöstä pitää saada tolkkua ilman vuosien paikkatietokoulutusta. ”Pyrimme dokumentoimaan tietosisällön mahdollisimman selkokielisesti, mutta kuitenkin täsmällisesti”, Henna-Kaisa Räsänen kertoo. Uotila arvioi, että avoimen datan julkaisuun meni kaikkiaan 70 työpäivää. Koko homma tehtiin omana työnä.

Jatkossa avaaminen helppoa

Jos alku oli työläs, niin nyt on helpompaa. Keväällä 2012 julkaistujen aikasarjojen lisääminen sujui jo kädenkäänteessä, kun koko prosessi oli kerran harjoiteltu. Tulevaisuudessa aikasarja saa jatkoa vuosittain. Uudet asukas- ja rakennustiedot avataan tuoreeltaan tietojen valmistuttua.

Suvi Uotila odottaa myös omistajakuntia avoimen datan talkoisiin. ”Esimerkiksi kuntien kaavoituksen pohjana toimivien tarkkojen kartta-aineistojen avaaminen hyödyttäisi oikeasti yhteiskuntaa.” Hallitusohjelmaankin kirjattua julkisen tiedon avaamista hidastaa se, että monet digitaaliset aineistot tuottavat talousvaikeuksissa painiville kunnille tuloja. Paperimaailmaa varten luotu kuntien maksuperustelaki antaa mahdollisuuden periä esimerkiksi koko Helsingin kattavasta digitaalisesta kantakartasta lähes 9 000 euroa. Nämä eurot pitäisi saada tulona jostain muualta, jos kartta-aineisto muuttuisi avoimeksi. ”Vaikka Google-kartta on kiva, se ei ole kovin laadukas. Viranomaiset tuottavat paljon laadukkaampaa ja ajantasaisempaa karttamateriaalia. Vaarana on, että kuntien tuottama laadukas tieto jää hinnan takia käyttämättä. Olisi hienoa nähdä ne laajassa käytössä, mutta siihen on kyllä vielä pitkä matka”, Uotila pohtii.

Virheet löytyvät talkootyönä

Nyt odotellaan, mitä data-avauksen tuloksena syntyy. Aineistoa on jo käytetty yliopistokurssin harjoitustyömateriaalina ja presidentinvaalien tulosten visualisoinneissa. Suvi Uotila toivoo, että joku innostuisi rakentamaan interaktiivisen sovelluksen, jolla voisi tutkia pääkaupunkiseudun asukas-, työpaikka- ja yritystietoja kartalla. ”Palvelu voisi näyttää myös alueen asuntoilmoitukset ja avoimet työpaikat”, Uotila visioi.

Datan julkaisu on poikinut uudenlaisia yhteydenottoja aiemmin virkamieskunnan kanssa asioineelle kuntayhtymälle. Aineiston lataajat toivovat nykyistä detaljoidumpaa tietoa ja kysyvät hyviä kysymyksiä. Julkaistussa paikkatietoaineistossa vangit ja muu laitosväestö on tietosuojan takia päätetty niputtaa yhteen ja tunnistamattomaan sijaintiin. ”Meiltä on kyselty, että mikä laitos täällä Suomenlahdella oikein on”, Uotila nauraa. Myös datan virheet löytyvät talkootyönä nopeasti. ”Esimerkiksi vuoden 1998 rakennustiedoissa oli ylimääräinen nolla, jonka tietojen lataaja löysi.”

Suvi Uotila kertoo, että vuoropuhelusta HRI-hankkeen ihmisten kanssa on ollut paljon apua. ”He ovat auttaneet ajatustyössä, mitä kannattaa julkaista ja miten se tehdään. Nyt he rummuttavat julkaisuamme sosiaalisessa mediassa. Tänä keväänä olemme selvittäneet tietosuoja-asioita selvitetty yhdessä heidän juristinsa kanssa. Ja ovat he vähän potkineetkin eteenpäin.”