IoT-data tottelee Pythonia

Aapo Rista kannustaa rohkeuteen datan avaamisessa. Alkuun tiedon avaamisessa pääsee Excel-tiedostoilla, hienostuneempia dataformaatteja ja rajapintoja voi rakennella käyttäjien toiveiden mukaan myöhemmin.
”Pistä data vain jakeluun, kerro mitä ongelmia siinä voi olla ja muistuta, että vastuu on käyttäjällä.”

Forum Viriumin erikoisasiantuntija Aapo Rista haluaa automatisoida kaupungin mittaustiedon keruun. Työkaluina ovat uudet halvat etäluettavat anturit ja Python-ohjelmointikieli.

Jos haet kaupunkidataa Suomen suurimpien kaupunkien avoimista rajapinnoista, saatat hyödyntää Forum Viriumin Aapo Ristan kirjoittamaa koodia. Hän on ollut edistämässä useammankin HRI-palvelusta löytyvän rajapinnan käyttöönottoa. Rajapinnat välittävät esimerkiksi kaupunkien tapahtuma- ja päätöstietoja eri sovellusten käyttöön. Myös vuoden data-avauksena palkittu Helsingin uimavesien lämpötilan verkkoon välittävä järjestelmä on ATK-insinööriksi itsensä esittelevän Ristan käsialaa.

”Paino on sanalla automaattinen. Ennen asioita on mitattu käsin ja näpytelty eri järjestelmiin. Minun tavoitteeni on, että sensori viedään vain paikan päälle, ja mittausdata on kaikkien käytössä ilman mitään säätöä. Tällainen automatisointi säästää aikaa ja vaivaa”, Aapo Rista selvittää.

Juuri nyt Ristaa kiinnostaa erityisesti datan keruu IoT (Internet of Things) -antureilla ja sen jakelu avoimena datana kaikkien käyttöön.
”Datan tallentaminen, siirtely paikasta toiseen ja jakaminen muiden käyttöön ovat kiehtovia ongelmia.”

Ristan suosikkityökalu datan ja tietokantojen käsittelyyn on Python-ohjelmointikieli ja sen erilaiset softakirjastot. Yksi suosikkikirjastoista avoimen datan käsittelyssä on Python Requests, jolla pääsee hakemaan dataa REST-rajapinnoista. ”Viime aikoina olen opiskellut erityisesti datan analysointia ja visualisointia ja niihin liittyviä visualisointi- ja koneoppimiskirjastoja. Alkutaipaleella kuitenkin vielä ollaan.”

Aapo Ristan ideoimat anturit keräävät jo täyttä häkää tietoa niin Helsingin uimavesien lämpötiloista kuin purojen vedenkorkeuksista. Mittaus-, sääennuste- ja valuma-aluetietoa yhdistämällä data-analyytikko voisi rakentaa esimerkiksi algoritmin, joka osaa ennustaa vesistöjen pinnankorkeuden tulevia vaihteluja.
”Python-koodin kirjoittamiseen ja muokkaukseen olen käyttänyt jo 10 vuotta PyCharm-editoria. Se paranee vuosi vuodelta ja nopeuttaa työtä. Tuntuu, että se osaa jo ennustaa seuraavan komennon”, Rista kertoo.

Kolmas käteväksi osoittautunut työkalu on avoimen lähdekoodin QGIS-paikkatieto-ohjelmisto: ”Se on hyvä työkalu, kun pitää saada nopeasti jokin paikkatietoaineisto näkyviin. Ja kun jaksaa opetella, sillä pystyy tekemään vaikka minkälaisia paikkatiedon visualisointeja ja omannäköisiä karttoja. Se on hieno softa, jonka haluaisin oppia paljon paremmin.”

Digikarttojen puute korjaantui

Kuvakaappaus.
Ristan 20 vuotta sitten koodaamalta verkkosivulta voi tarkastella 2000-luvun alun näkymiä Katajannokalla. Taustakartan virkaa toimittaa puhelinluettelosta napattu kuva.

Aapo Ristan innostus avoimen datan penkomiseen on peräisin jo viime vuosituhannelta. Tietotekniikan opiskelija ylipuhui isänsä hankkimaan varhaisen GPS-tallentimen. ”Kun pyöräilee tai veneilee, on kiva jälkeenpäin katsoa tallennettua jälkeä kartalla.”

Samoihin aikoihin ilmestyivät markkinoille ensimmäiset toimivat kuluttajien digikamerat, ja Rista ryhtyi tutkimaan, miten valokuvat saisi helposti kartalle. Ratkaisu löytyi yhdistämällä gps-paikantimen ja digikameran valokuvien aikaleimat tietokoneella. Tietyllä ajanhetkellä otettu kuva saatiin kartalle gps:n tallentaman sijaintijäljen ja kellonaikojen perusteella.

”Se oli makea juttu, mutta ongelmaksi muodostui, että digitaaliset kartat olivat harvinaisia – ja maksullisia.”

Rista innostuu haastattelun lomassa kaivelemaan internetiä, ja hetken päästä ruudulle ilmestyy paperisista puhelinluetteloista tuttu Katajanokan kartta 20 vuoden takaa. Kartalle merkatuista pisteistä saa avattua varhaisen digikuvan kyseisestä sijainnista. ”Voi, tämä on vielä olemassa”, Rista ilahtuu.

Digitaalisten karttojen puute korpesi sovellusta tehdessä siinä määrin, että Aapo Rista marssi pian kaverinsa kanssa eduskuntaan kansanedustaja Jyrki Kasvin luo. ”Kerroimme, että meidän mielestämme tällaisten verovaroin kustannettujen karttojen pitäisi olla avointa dataa.”

Samoja ajatuksia oli muillakin. Avoimen datan liike pääsi pian vauhtiin Suomessa, ja HRI-palvelun pystytys alkoi.

20 vuotta myöhemmin kaupunkien digitaalinen paikkatieto onkin oletusarvoisesti avointa dataa. Kartat on HRI-palvelun suurin datakategoria, ja historialliset kartat ja ilmakuvat ovat nousseet yhdeksi palvelun suosituimmista aineistoista.

Kuka?

Aapo Rista s.1971

Koulutus ATK-insinööri
Työpaikka Forum Virium Helsinki, erikoisasiantuntija

Avoimen datan suosikkityökalut
1. Python-ohjelmointikieli ja sen softakirjastot
2. Avoimen lähdekoodin QGIS-paikkatieto-ohjelmisto
3. Python-editori PyCharm

Mitä tehnyt avoimella datalla

”Vuonna 2006 teimme tolppa.mobi -sovelluksen, joka haki bussipysäkin numeron perusteella lähistöllä otetut valokuvat avoimesta Albumit auki -kuvatietokannasta. Se oli hauska koodata, ja HKL mainosti sovellustamme koko kesän pysäkeillään.”

Mikä data kiinnostaisi

”Helsingin ja koko Suomen liikennelaskentapisteiden ja liikennevalojen reaaliaikainen tiladata.”

Mac, Windows vai Linux

“Mac työkoneena, serverit Linuxeja. Tällainen Unix-tyyppinen ympäristö on minulle tutuin.”

Terveiset HRI:lle

“HRI voisi olla edistää harmonisoitua datarajapintaa kaikelle mahdolliselle kaupunkidatalle. Optimistina haluan uskoa, että sellaisen voisi rakentaa, mutta se on kyllä aikamoinen homma.”

LinkedIn-sivu

https://www.linkedin.com/in/aaporista

Twitter-tili

https://twitter.com/aapris

IoT-antureista tuli totta

Myös toinen Aapo Ristan nuoruuden haave on toteutunut. Pienellä virralla toimivat etäluettavat mittalaitteet ovat nyt todellisuutta. IoT-mittalaitteiden paristot kestävät vuosia, ja ne ovat saaneet kaverikseen LoRaWAN-verkon, joka yhdistää anturit internetiin.
”Se on tosi hyvä se verkko. Voin viedä sensorin minne vain pääkaupunkiseudulla, ja data kulkee vaikka maan alta ja katukuiluista. Näitä teknologioita olen odottanut koko elämäni, ja nyt ne ovat täällä”, Rista iloitsee.

Forum Virium Helsingin IoT-asiantuntijalla onkin mielessä koko joukko erilaisia dataa kerääviä anturiverkkoja kaupungin tarpeisiin, vesistöjen mittauksista aina kuivan maan paikallisiin sääasemiin.

Vaikka kaupungin tietovarantojen avaaminen on päässyt hyvään vauhtiin, paljon hyödyntämiskelpoista dataa on vielä lukkojen takana. Mitkä ovat avoimen kaupunkidatan pioneerin vinkit muille kaupunkidatan avaajille?
”Ensimmäinen askel on laittaa data saataville ihan missä tahansa muodossa”, Rista neuvoo.

Moni kantaa huolta datan laadusta, Ristan mukaan täysin turhaan. Suurempi huolenaihe on se, ettei kukaan pääse käyttämään dataa.
”Jos lähtee tekemään liikaa laadunvarmistusta, avaamisessa menee helposti vuosia. Tämä oli tilanne 15 vuotta sitten karttadatan kanssa. Nyt avoimen karttadatan jakelu on arkipäivää, eikä ongelmia kai hirveästi ole.”

Seuraava askel datan jakelussa on rakentaa sille koneluettava rajapinta. Niitä Rista on ollut rakentamassa 6Aika-hankkeessa niin Helsingin kuin muiden kuutoskaupunkien käyttöön. Nyt kaupunkien dataa omissa sovelluksissaan hyödyntävillä onkin edessään aikamoinen rajapintojen viidakko.
”Rajapintojen harmonisointi olisi kova juttu. Ehkä kaupungilla voisi olla yksi ainoa rajapinta, josta voisi hakea kaikkea dataa mahdollisimman yhtenäisessä muodossa. Tämä ei tapahdu ihan hetkessä, mutta ehkä viiden vuoden sisällä”, Rista toivoo.

Rista teki ensimmäisen avointa dataa hyödyntäneen sovelluksensa vuonna 2006. Tolppa.mobi -sovelluksesta pystyi hakemaan bussipysäkin numerolla lähialueen kuvia avoimesta Albumit auki -tietokannasta.