Vuoden data-avaus auttaa kaupunkipyöräilijää
Helsingin ja Espoon kaupunkipyörillä poljettiin toissakesänä yhteensä 158 kertaa maapallon ympäri. Koko kauden ostaneita pyöräilijöitä oli yhtä paljon kuin porvoolaisia, yli 48 000. Yksittäisiä matkoja tehtiin reilusti yli kolme miljoonaa. Ja nämä luvut ovat vain vuodelta 2018 – kaikkiaan dataa kertyy nyt jo viidettä vuotta. Kaupunkipyörien käytöstä karttuva valtava määrä dataa on ollut nyt puolisen vuotta saatavilla avoimena datana.
Helsingin Seudun Liikenteen (HSL) marraskuussa 2019 avaama Helsingin ja Espoon kaupunkipyörillä ajetut matkat -aineisto sisältää anonymisoidut tiedot yksittäisten matkojen lähtö- ja päätösasemista ja -ajoista, pituuksista sekä kestoista.
HRI:n ohjausryhmä valitsi kaupunkipyörädatan vuoden 2019 parhaaksi data-avaukseksi. Ohjausryhmä pitää avausta merkittävänä, koska “kaupunkipyörät ovat osoittautuneet hyvin suosituiksi ja pyörien käyttödataa on toivottu avattavan jo pidemmän aikaa. Data tarjoaa hienon mahdollisuuden analysoida kaupunkilaisten liikkumista, pyöräilyn ajankohtia ja volyymiä.” Samaa dataa käytettiin kaupunkipyöräasemaverkon suunnittelussa jo ennen kun se oli avattu. Ennen avaamista dataa sai pyydettäessä mm. tutkimuskäyttöön.
“Kaikki mitä voi avata, avataan”
HSL on yksi datan avaamisen pioneereja Suomessa. Sen periaatteena on jo pitkään ollut, että kaikki data, mitä voidaan avata, avataan. Kaupunkipyöriinkin liittyen avattiin heti niiden lanseerauksen aikaan pyöräasemien sijaintitiedot sekä pyörien reaaliaikainen määrä niillä. Aika pian alettiin toivoa avoimeksi dataksi myös pyörillä ajettuihin matkoihin liittyviä tietoja, muistelevat Markku Huotari ja Sami Räsänen HSL:stä.
Ennen avaamista piti kuitenkin huolehtia pyöräilijöiden yksityisyydensuojasta ja ratkoa teknisiä kysymyksiä. Ihmisten liikkumiseen liittyvän datan avaamisessa täytyy huomioida EU:n yleinen tietosuoja-asetus (GDPR). Siksi datassa ei ole mitään tietoa käyttäjistä, edes ID-numeroita. Kaupunkipyöräpalvelusta vastaavan City Bike Finlandin toiveesta myös pyörien yksilöivät tunnisteet jätettiin avattavasta datasta pois. Lisäksi dataa siivottiin, yhtenäistettiin ja muokattiin koneluettavampaan muotoon. Datasta myös poistettiin muutamia kymmeniä matkoja, joiden päättymisajankohta oli jostain syystä jäänyt tallentumatta.
Datan avaamisesta ei tullut HSL:lle kuin nimellisiä kuluja. Avausta edistettiin osin omana työnä, osin konsultin kanssa. Tarvittavat datan muokkaustyöt HSL teki itse.
Visualisointeja syntyi nopeasti
Kaupunkipyörädataa on ladattu HRI:n sivuilta ahkerasti ja sen pohjalta on luotu useita kiinnostavia visualisointeja. Ensimmäiset visualisoinnit syntyivät miltei samoin tein datan julkaisemisen jälkeen. Huotari ja Räsänen kertovat tyytyväisinä erilaisista sovelluksista ja visualisoinneista, joissa on käytetty kaupunkipyörädataa. Kaupunkipyörädataa on käytetty myös korkeakouluissa.
Huotari nostaa esiin Markus Kainun tekemän palvelun, johon kaupunkipyörädataa kertyy viiden minuutin välein vuodesta 2017 lähtien. Palvelusta saa dataa vapaista pyöristä, asemista, säästä sekä sääennusteesta niin ikään avoimena datana. Kainun käsialaa on myös Tellinkibotti, joka esittelytekstinsä mukaan ”twiittailee kaupunkifillarijärjestelmän koho- ja epäkohdista kerran pari päivässä”.
Räsänen kertoo myös viime syksynä järjesteystä, kaikille avoimesta hackathonista Lamian kanssa. Hackathonissa hyödynnettiin myös kaupunkipyörien dataa. Hackathonin voittajatiimi käytti kaupunkipyörien historiadataa ja laati ennusteen, miten pyöriä on saatavilla eri asemilla.
Kaupunkipyörien saatavuuden ennustaminen onkin todella kiinnostavaa. Historiadataa sekä asemien reaaliaikaista tilannetta yhdistelemällä voi päästä pitkälle ennusteissa pyörien saatavuudesta. Lisäksi sää ja tapahtumat vaikuttavat pyörien käyttöön. Räsänen kertoo, että esimerkiksi Kaivopuistoon hyvin näkynyt lentonäytös keräsi taannoin noin kolmanneksen kaikista kaupunkipyöristä Kaivopuiston tienoille. Myös vappuna pyörät siirtyvät Kaivopuistoon ja Flow’n aikaan Suvilahteen.
Palveluntajoaja City Bike Finland tasaa jatkuvasti pyörien määrää eri asemilla kuljettamalla pyöriä täysiltä asemilta tyhjemmille ja kerää dataa myös tästä. Tätäkin dataa on toivottu avattavan mieluiten reaaliaikaisena – tyhjällä asemalla seisovaa kaupunkipyöräilijää auttaisi tieto, että asemalle on piakkoin tulossa lisää pyöriä.
Jatkokehitysideana tiedot pyöräasemista
HSL:lle ei ole tullut toiveita kaupunkipyörädatan kehittämisestä, kertoo Huotari. HSL:n tiedossa oleva kehittämiskohde on kaupunkipyöräasemien sijainnit – asemien sijainnit ja koot kun vaihtelevat hieman paitsi vuosittain, myös mahdollisesti kesken kautta pyörien kysynnän sekä rakennustöiden vuoksi. Nyt HSL:n avaama, kerran vuodessa päivittyvä asemien sijaintidata kertoo vain tietyn poikkileikkaushetken tiedon. Osa vanhoista sijainneista on pääteltävissä asemien nimistä, mutta kattavaa dataa menneiltä vuosilta ei vielä ole saatavilla.
Vantaan kaupunkipyörillä on eri palveluntarjoaja kuin Helsingillä ja Espoolla, joten Vantaan kaupunkipyörädataa ei ole avattu samalla kuin Helsingin ja Espoon. Siksi myös Vantaan kaupunkipyöräasemat on avattu erillisenä aineistona. Vantaan kaupunkipyörillä ajettujen matkojen avaamista selvitetään vielä.
Työn alla historiadataa ajoneuvojen sijainneista
Huotarilla ja Räsäsellä on jo työn alla HSL:n seuraavat data-avaukset. HSL:n jo yli kymmenen vuotta avoimina olleiden Reittioppaan rajapintojen kautta saa nyt ajoneuvojen reaaliaikaiset sijaintitiedot. Suunnitteilla on julkaista avoimena datana myös ajoneuvojen sijaintien historiatietoa, jota on saatavilla vuoden 2019 syyskuusta alkaen. Data on tarkoitus avata kesän aikana.
Myös HSL:n bluetooth-majakka API:a ollaan laajentamassa ensi vuonna. Ainakin kaupunkipyöräasemille on tulossa majakat; pyöriin majakoita ei tule. Majakat mahdollistavat GPS:ää tarkemman paikannuksen ja toimivat myös backupina GPS:lle. Ajoneuvojen majakat kertovat, minkä ajoneuvon kyydissä matkustaja on. Tämä helpottaa mm. HSL:n omien käyttäjätutkimusten tekemistä.
HSL:ssä kehitetään paraikaa myös matkustajamäärädatan keräämisen menetelmiä. Data on tarkoitus ottaa käyttöön ensin HSL:n sisäisissä prosesseissa, mutta jossain vaiheessa sitä tulee tarjolle myös avoimena datana. “Tämä tulee kuitenkin viemään jonkin verran aikaa, kun korvataan nykyisin pääosin matkakorttileimauksiin ja niitä täydentäviin manuaalilaskentoihin nojaavat ratkaisut nykyteknologian tajoamilla mahdollisuuksilla”, toteaa Huotari.
Näin data avattiin
2016 toukokuu Ensimmäiset iloisenkeltaiset kaupunkipyörät ilmestyvät Helsingin katukuvaan. Pian niiden käytöstä kertyvää dataa aletaan toivoa myös avoimena datana.
2018 Ajatusta datan avaamisesta viedään eteenpäin HKL:ssä, joka tarjoaa kaupunkipyöräpalvelua Helsingin osalta.
2019 syyskuu Kaupunkipyörien ohjausryhmässä päätetään julkaista anonymisoitu data avoimena datana.
2019 marraskuu Helsingin ja Espoon kaupunkipyörillä ajetut matkat vuodelta 2019 lisätään HRI:n datakatalogiin.
2020 tammikuu Avaukseen lisätään vuosien 2016-2018 datat. Historiadata vaati muokkaamista, että se saatiin yhteneväiseen muotoon vuoden 2019 datan kanssa.
2020 helmikuu HRI:n ohjausryhmä palkitsee Helsingin ja Espoon kaupunkipyörillä avatut matkat vuoden 2019 parhaana data-avauksena.
Vinkkejä datan avaajille
HSL:n Markku Huotarin ja Sami Räsäsen vinkkejä dataa avaaville tai datan avaamista suunnitteleville:
- Avaa kaikki data, mitä on mahdollista avata.
- Ajattele avausta loppukäyttäjän näkökulmasta: mille datalle on tarvetta ja miten ja missä formaatissa käyttäjä haluaisi saada datan.
- Formaattia tärkeämpi on toisaalta se, että data on saatavilla. Datan formaatteja ja rakennetta voi avaamisen jälkeen hioa käyttäjien toiveiden perusteella.
- Datan ei tarvitse olla täydellistä, vaan dataa voi jatkojalostaa palautteen ja toiveiden mukaan. Avaamista ei kannata jättää tekemättä sen vuoksi, että kokee datan olevan epätäydellistä.
- Mitä lähempänä avattava data on alkuperäistä dataa, sen parempi loppukäyttäjälle. Data kannattaa avata “niin raakana kuin mahdollista”.
- Jotain korjauksia ja muokkauksia voi tehdä, erityisesti datan yhteneväisyyden näkökulmasta. Näin käyttäjän ei tarvitse korjata virheitä ja esittää kysymyksiä datan omistajalle.
Mitä sinä tekisit tai olet jo tehnyt kaupunkipyörädatalla? Mitä toivoisit sillä tehtävän? Millaiset sovellukset tai visualisoinnit auttaisivat kaupunkipyörän satulaan hyppäävää? Tai onko sinulla toiveita kaupunkipyörädatan jatkojalostamisesta? Kysy, kommentoi, keskustele, otamme palautetta mieluusti vastaan!