Pikaopas datan avaamiseen


Julkisen datan arvo kasvaa kun sitä käytetään. Datavarantojen avaaminen on yllättävän helppoa.

1Valitse julkaistava data

Aloita datan avaaminen aineistoista, joita eniten himoitaan. Parhaassa tapauksessa voit helpottaa omaa työtäsi.

Onko tietokanta jo valmiiksi julkaistavassa formaatissa? Julkaise se ensin. Pyydetäänkö samaa Excel-taulukkoa kerta toisensa jälkeen? Julkaise taulukon raakadata verkossa ja neuvo kyselijöitä koostamaan oma tilastonsa. Voit listata tärkeimmät tietovarantonne ja kysyä sovelluskehittäjiltä, mikä datasetti näistä eniten kiinnostaisi.

Tai voit seurata rahaa: minkä tiedon kerääminen ja ylläpito maksaa teille eniten? Se on varmasti arvokasta muillekin. Vasta kokeilemalla selviää, mikä tiedon hyödyntäjiä lopulta innostaa.

Esimerkiksi HRI:n sivuilla avoimena datana julkaistu numeroaineisto Helsingin liikenneonnettomuuksista päätyi näyttävinä visualisointeina Helsingin Sanomien, Suomen Kuvalehden ja MTV3:n sivuille.

2Oikeudet kuntoon

Jotta dataasi voidaan hyödyntää, käyttäjä tarvitsee siihen lailliset oikeudet. Mahdollisimman laajat oikeudet kannustavat tiedon käyttämiseen.

Suurin osa julkishallinnon datasta on julkisuuslainsäädännön perusteella julkista. Selvitä kuitenkin, rajoittavatko tekijänoikeudet aineiston luovuttamista ja ettei data loukkaa yksityisyydensuojaa. Käyttöehdoissa voit hyödyntää kansainvälistä Creative Commons -lisenssimallia tai HRI-hankkeen mallilisenssiä. Selkeät ja standardeja noudattavat käyttöehdot vähentävät niin datan julkaisijan kuin käyttäjien työtä.

Esimerkiksi Helsingin seudun ympäristöpalvelut HSY valitsi HRI-lisenssin julkaistessaan avointa dataa pääkaupunkiseudun kaavoitetuista, mutta rakentamattomista maavarannoista. Tietosuojan turvaamiseksi tonttikohtainen data yleistettiin kaupunginosakohtaiseksi.

3Julkaise verkossa

Julkaise datasi koneluettavassa muodossa. HTML- ja PDF-tiedostot sopivat ihmisille, mutta tietokoneet arvostavat XML:ää.

Tiedon käyttäjille tärkeintä on, että data on saatavilla ohjelmallisesti käsiteltävässä muodossa ja avoimessa formaatissa. Ensimmäisessä datajulkaisussa ei kannata hienostella: tietokannan sisältö tallennetaan pilkkueroteltuun tiedostoon ja tallennetaan omille verkkosivuille yhdessä sisältökuvauksen kanssa. Käyttäjäpalautteen pohjalta voi sitten rakentaa hienostuneempia rajapintoja.

Esimerkiksi pääkaupunkiseudun kirjastojen aineistotiedot julkaistiin aluksi 2 GB:n kokoisena raakatiedostona. Myöhemmin rakennettiin rajapinta, jonka kautta voi tehdä hakuja suoraan kirjaston tietokannasta.

4 Kerää palautetta, keskustele

Avoimella datalla on arvoa vasta, kun sitä käytetään. Tee julkaisusi näkyväksi HRI:n datakatalogissa ja kuuntele hyödyntäjiä.

Ilmoita datajulkaisusi HRI:n ylläpitämään datakatalogiin. Seuraa millaisen vastaanoton datajulkaisusi saa Facebookissa tai Twitterissä. Kerää palautetta myös käyttäjätapaamisissa ja Apps4Finlandin kaltaisissa sovelluskilpailuissa. Palautteen avulla seuraava datajulkaisusi on vielä suurempi menestystarina.

Esimerkiksi Helsingin seudun liikenne HSL järjesti joukkoliikenteen reittioppaan datan avausta vauhdittamaan kilpailun, jossa etsittiin parhaita dataa hyödyntäviä mobiilisovelluksia. Suosio oli valtaisa, kaikkiaan 60 mobiilisovellusta osallistui kilpailuun.


  • Teoksen tekstit on lisensoitu HRI-nimeä -lisenssillä. Teoksen uudelleenkäytön yhteydessä pitää mainita sekä tekstin kirjoittaja (Petja Partanen tai Terhi Upola) että rahoittaja (Helsinki Region Infoshare -palvelu). 

Tutustu edelläkävijöiden tarinoihin

Helsingin seudun joukkoliikenteestä vastaavan HSL:n projektipäällikkö Jari Honkonen voi tarkastaa kännykällään, missä ratikat liikkuvat. Kiitos parantuneesta joukkoliikenneinformaatiosta kuuluu yksityisille sovelluskehittäjille. Honkonen pitää vain huolen siitä, että rajapinnat HSL:n joukkoliikennetietoon ovat avoimesti kaikkien käytössä.

jarihonkonen1.jpg