Seudulliset paikkatiedot hyötykäyttöön
SePe on harmonisoinnin vuoksi riippumaton kuntien ylläpitojärjestelmistä ja ylläpitotavoista. SePen ominaispiirteitä ovat myös historiatiedon säilyttäminen ja se että kaikki kohteet ovat aitoa paikkatietoa relaatiotietokannassa. Esimerkiksi rakennusta voi seurata aina hankkeesta valmistumiseen ja purkamiseen asti ja rakennukseen liittyvät muut kohteet (esim. kiinteistö, väestö) voidaan helposti löytää. Nämä ominaisuudet ovat oleellisia myös seudullisen avoimen datan tuottamisessa, jota käsittelen tässä kirjoituksessa myöhemmin.
Avatuista paikkatietoaineistoissa esitetään rakennus-, väestö- ja rakennusmaavarantotietoja. Tiedot on yleistetty summaamalla erilaisiin alueisiin. Yleistys on tehty tietosuojakysymysten takia ja siitä ollaan erityisen tarkkoja väestötiedon osalta. Rakennustietoruudukossa esitellään rakennusten lukumääriä, käyttötarkoituksia ja kerrosaloja eri kriteerein. Lisäksi rakennusaineistoon on laskettu aluetehokkuus, joka tarkoittaa rakennetun pinta-alan suhdetta maapinta-alaan. Väestötietoruudukossa taas esitetään väestön lukumäärä yhteensä sekä ikäluokittain ja asumisväljyys. Väestö- ja rakennusruudukot on julkaistu sekä Mapinfo TAB että Esrin Shape-formaateissa.
Kolmas julkaistu aineisto, kaupunginosittainen rakennusmaavaranto, perustuu HSY:n SeutuRAMAVA-tietotuotteeseen. Rakennusmaavaranto kuvaa yleisenä käsitteenä kaavoitettujen alueiden rakentamismahdollisuuksia suunnittelutilanteesta ja kaavoitusvaiheesta riippumatta. SeutuRAMAVAan on lisäksi laskettu 40-luokkainen omistajalajiluokitus, josta julkaistuun aineistoon on poimittu kolme pinta-alallisesti suurinta omistajalajia. SeutuRAMAVAsta tarkemmin HSY:n sivuilla. Aineisto on julkaistu kolmessa eri formaatissa.
Kaikkien aineistojen käytössä ja ymmärtämisessä oleellisia ovat tietokuvaukset. Ilman niitä käytetyt muuttajat eivät aukea käyttäjälle.
Miten rekisteristä avoimeksi dataksi?
Rekisteriaineistot sisältävät yleisesti melkoisen koodiviidakon ja paljon kryptisiä lyhenteitä. Ne eivät yleensä aukea kuin järjestelmien ylläpitäjille ja aktiivikäyttäjille. Tämän takia rekisteriaineistoa pitääkin ”kansankielistää” eli selittää auki koodituksia, lyhenteitä ja löytää näille yleistajuisia merkityksiä. Eri kunnissa koodituksissa ja ylläpitokäytännöissä on niin paljon eroja, että ilman harmonisointia seudullista aineistoa ei voisi tuottaa.
Aineistoa täytyy lisäksi yleistää yleisemmälle tasolle tietosuojakysymysten takia. Esimeriksi Tilastokeskus vaatii tilastolaitoksilta, että väestön rakenteen tietoja ei saa esittää, jos lukumäärä on alle sadan. Säännökset on tehty yksilönsuojaa ajatellen, jotta aineistoista ei pysty yksilöimään ketään tai mitään. Koska avointen tietojen käyttötarkoitusta ei voi säädellä, pitää olla tarkkana mitä julkaisee.
Avatuilta tiedoilta vaaditaan myös kokonaisuuksia. Avattujen tietojen täytyy olla selkeitä, yksiselitteisiä kokonaisuuksia, jotta niitä olisi helppo käsitellä edelleen. Tässä tapauksessa käytännössä tiedot ovat osittain eri kohteita (esim. rakennukset ja rakennusten käyttötarkoitukset ovat eri kohteita), vaikka ne olisivatkin peräisin samasta järjestelmästä. Tämä vaatii aineistolta joko relaatiotietokantaa tai geometristen elementtien kautta linkittämistä. Esimerkiksi SeutuRAMAVAn laskennassa on hyödynnetty yli kahtakymmentä kohdeluokkaa, jotka ovat omissa tietokantatauluissaan. Yhden aineistotuotteen takana saattaa siis olla kymmeniä eri tietokohteita ja niiden takana voi olla massiiviset tietovarannot, joita on keskenään yhdistelty.
Neljäs vaatimus rekisteriaineistosta tuotetulle avoimelle datalle on tiedon laatu. Lähtöjärjestelmän tietojen laadun pitää olla jatkuvasti ylläpidetty ja kunnossa ennen kuin niitä julkaistaan. Huonolaatuiset tiedot aiheuttavat enemmän ihmetystä ja ongelmia kuin niistä on hyötyä. Paikkatiedon laatuun kuuluu tiedon sisällöllinen laatu (oikeellisuus), sijainnillinen tarkkuus sekä aineistojen kuvaus eli metatiedot. Kaikkien laadun elementtien pitää olla kunnossa, jotta tieto olisi hyödyllistä käyttäjilleen.
Mitä seuraavaksi?
HSY jatkaa avoimen datan tuottamista jatkossakin. Joulukuussa 2011 aineistot ovat vuoden 2010 rekisteritilanteesta ja pyrimmekin julkaisemaan samojen aineistojen 2011 rekisteritilanteen jo kevään 2012 aikana. Tämän jälkeen aineistot tullaan päivittämään vuosittain. Tutkimme myös mahdollisuuksia tarjota aineistoja rajapintojen kautta.
Lisäksi tällä hetkellä tutkitaan Helsingin kaupunkimittausosaston ylläpitämän Seutukartan mahdollisuuksia avoimeksi dataksi. Seutukarttaa rahoittavat HSY ja Helsingin seudun kunnat. Seutukartta on koko Helsingin seudun eli 14 kunnan kattava 1:50000-mittakaavainen kartta-aineisto.
Koska datan avaus on vasta tehty, odotan vielä mielenkiinnolla minkälaisia käyttökohteita aineistoillemme löytyy. Palautetta ja toiveita otetaan mielellään vastaan. Palautetta voi lähettää esimerkiksi palveluosoitteeseemme sepe@hsy.fi.
Kirjoittaja
Suvi Mikkola
Paikkatietoasiantuntija
Helsingin seudun ympäristöpalvelut -kuntayhtymä HSY