Numerodatasta karttataidetta QGISillä

Topi Tjukanovin visualisointiharrastus lähti liikkeelle maantieteen opinnoista.

Topi Tjukanovin omaperäiset visualisoinnit leviävät Twitterissä ympäri maailmaa. “On paljon käyttämättä makaavaa dataa, josta saa pienillä jutuilla tosi paljon irti.”

Toimistoaikaan ministeriön virkamies, vapaalla karttataiteilija. Topi Tjukanovin vapaa-ajan harrastuksen hedelmiä jaetaan Twitterissä ahkerasti. Yhdysvaltain tieverkon visualisoinnit ovat päätyneet esimerkiksi Daily Mailiin ja Redditin etusivulle. YLEn uutissivuille Tjukanov on visualisoinut arktisen jääpeitteen kokoa vuosittain. “Tykkään tiedon popularisoinnista”, Tjukanov perustelee harrastustaan.

Tjukanov luonnehtii avoimista datavarannoista luomiaan visualisointeja luonnoksiksi. “Ne eivät ole mitään valmiita sovelluksia, joiden pitäisi kestää 10 000 yhtäaikaista käyttäjää. On vain kiva tutkia dataa ja saada siitä joku visuaalinen lopputulos, jonka voi jakaa omalle verkkosivulleen tai Twitteriin.”

Vaikka visualisointiharrastus on kokeilua ja askartelua, karttaa Tjukanov suuritöisiä projekteja. “Vapaa-ajalla sitä haluaa tehdä jotain muutakin kuin istua koneen äärellä.”

Lopputuloksia katsellessa on vaikea uskoa, että useimmat visualisoinnit ovat syntyneet muutamassa tunnissa. Esimerkiksi Helsingin rakennusdataa hyödyntävä gif-animaatio näyttää havainnollisesti, millainen kasvuräjähdys pääkaupungissa tapahtui 1960-luvulla alkaneen lähiörakentamisen myötä. Aluksi Tjukanov loi siivotusta datasta QGIS-ohjelmalla 200 erillistä kuvaa kunkin vuoden rakennuskannasta. Sitten hän yhdisti ne kuvankäsittelyohjelmassa gif-animaatioksi. Tyyli on ehtaa Tjukanovia: valmiiksi pureksittu mediaystävällinen visualisointi, jota on helppo jakaa sosiaalisessa mediassa. Paljonko tällaiseen menee aikaa? “Jos tekisin sen nyt uudestaan, niin varmaan puoli tuntia.”

Junat Suomen rataverkolla. Animaatio: Topi Tjukanov.

Trumpin twiiteistä maan syrjäisimpään pisteeseen

Haastattelun aikaan kesäkuussa 2018 Topi Tjukanov on etsimässä paikkatietomenetelmin Suomen syrjäisintä paikkaa. Idea tuli belgialaiselta datavisualisoijalta, joka pyysi Tjukanovilta apua kotimaansa rakennusdatan analysointiin. Heinäkuun kuluessa Tjukanovin yli 5 000 Twitter-seuraajaa saavat tietää, että Suomen syrjäisin piste sijaitsee Lemmenjoen kansallispuistossa, 14,1 kilometrin etäisyydellä lähimmästä rakennuksesta. Pian seuraa vastaava analyysi Tanskasta ja Isosta-Britanniasta.

Elokuussa käynnissä on jo uusi projekti. Presidentti Trumpin tweetit muuttuvat Tjukanovin koodaaman Trump Lost in Translation -botin käsittelyssä entistä mystisemmiksi. Ohjelma Google-kääntää Trumpin twiittejä satunnaisesti kieleltä toiselle ja lopuksi takaisin englannin kielelle.

Päiväsaikaan Tjukanov edistää ympäristöministeriössä maan kaavoitustietojen siirtämistä digitaaliseen muotoon. Visualisointiharrastus on hyvää vastapainoa ministeriön asiapitoiselle virkatyölle. “Kun visualisointeja tekee omaksi ilokseen, voi suhtautua asioihin huumorilla.”

Useimmat visualisoinnit syntyvät QGIS-ohjelmistolla. Datan esikäsittelyä varten Tjukanov on opiskellut Python-ohjelmointia. Tosielämän ongelmat lisäsivät motivaatiota Python-oppaan selaamiseen. “Kun on jokin oikea ongelma, silloin oppii nopeasti: esimerkiksi tuhat tiedostoa, jotka haluan nimetä uudestaan ja siirtää ne toiseen kansioon”, Tjukanov nauraa.

Helsingin 200 vuoden kehitys animoituna viiteentoista sekuntiin.

Taidetta paikkatiedosta

Paikkatietoalan ammattilehti Position jutussa Tjukanovia tituleerataan karttataiteilijaksi. Luonnehdinnasta imarreltu Tjukanov myöntää, että datan jalostus saattaa joskus lipsua taiteen puolelle. “Kaikki pohjautuu olemassa olevaan dataan, mutta joskus tulee tehtyä jotain vain sen takia, että se näyttää hyvältä.”

Kuka?

Topi Tjukanov s. 1988
Koulutus: Maantieteilijä, FM
Työpaikka: Ympäristöministeriö

Avoimen datan suosikkityökalut
1. QGIS “On kiva, että ohjelmaa voi käyttää kuka vain ilman lisenssimaksuja. Ohjelmiston kehitys on ollut tosi nopeaa.”
2. PostGIS
3. Python

Mitä tehnyt avoimella datalla
Helposti jaettavia gif-animaatioita paikkatiedosta, junien ja laivojen reaaliaikaisista liikkeistä aina kaupunkien kehitykseen halki vuosisatojen.

Mikä data kiinnostaisi
“Minua kiinnostaisi muun muassa Helsingin kaupunkipyörien käyttödata, mutta sitä ei tietosuojasyistä haluta hirveän detaljoidulla tasolla avata. Ymmärrän kyllä huolen, mutta monissa kaupungeissa tietoa on kyllä avattu. Kaikki liikkumisdata on sellaista, mistä saisi tosi siistejä juttuja.”

Mac, Windows vai Linux
“Windows, välillä käytän Linuxia virtuaaliympäristössä.”

Terveiset HRI-palvelulle
“Jatkakaa hyvää työtä.”

Topi Tjukanovin visualisointeja blogissa ja Twitterissä.

Taiteilijasieluun viittaa sekin, että datan käsittely on vain välttämätön paha. Kun data on hyvälaatuista, pääsee suoraan hauskimpaan vaiheeseen: miettimään, miten tieto kannattaisi esittää. “Paras vaihe on se, kun on parsinut datan ja pääsee valitsemaan värejä visualisointiin.”

Harrastus on poikinut joitakin freelance-keikkoja. Muun muassa Helsingin Sanomien Airbnb-jutun taustana on Topi Tjukanovin palvelun sivustolta raapima data Helsingin 2 700:sta Airbnb-palvelussa tarjolla olevasta vuokra-asunnosta. Päivätöitä hän ei kuitenkaan aio jättää, vaikka se ajatus on joskus mielessä käynyt. “Säännölliset palkkapäivät ja kahdeksasta neljään -työ on aika jees.”

HRI auttoi alkuun

HRI:ssa olevia datoja Tjukanov selaa aina silloin tällöin. Palveluun Tjukanov tutustui jo opiskeluaikana, kun hän opiskelukavereineen lähti rakentamaan sovellusta, joka kertoo mille Helsingin Kallion ravintolaterasseille aurinko juuri nyt paistaa. “Terassien sijaintidataa ei silloin ollut avoimena datana. Otimme yhteyttä HRI:n ihmisiin, data avattiin ja me saimme sovelluksen tehtyä”, Tjukanov muistelee.

Vuonna 2013 rakennettu Porottaa.com-verkkopalvelu toimii edelleen, mutta viiden vuoden takainen ravintoladata on jäänyt ajastaan jälkeen. Kallion ravintolakanta näyttää uudistuneen vauhdilla.

Ylipäänsä Tjukanov antaa julkishallinnon tiedon avoimuudelle arvosanaksi “kohtuullisen hyvä”. “Ainahan sitä toivoo, että voisi olla sitä ja sitä dataa olemassa. Mutta kun jakaa tekemisiään Twitterissä, muista maista tulee kommenttia, että olisipa meilläkin käytössä tällaista dataa.”

Moni Tjukanovin visualisointi käsittelee liikkumista. Datalähteinä ovat olleet avoimet tietovarannot, mutta jokaisen taskussa olevat matkapuhelimet tuottavat nykyisin uskomattoman määrän henkilökohtaista dataa. Visualisointijulkkiksen asemaan noussut Tjukanov on päässyt vilkaisemaan esimerkiksi amerikkalaisfirman dataa, johon on kerätty sijaintitietoa tuhannesta eri mobiilisovelluksesta. “He antoivat minulle testiaineiston katsottavaksi. Datan tarkkuus oli vähän pelottavaa. Sieltä näki esimerkiksi puhelimien sijainnin, nopeuden, millä kielellä puhelinta käytetään, paljonko akkua on jäljellä”, Tjukanov kertoo. “Sitä ei osaa kuvitellakaan, mitä kaikkea dataa meistä on olemassa.”

Euroopassa EU:n uusi tietosuoja-asetus huolehtii ihmisten yksityisyydensuojasta paljon Yhdysvaltoja paremmin. HRI-palvelu edistää ainoastaan julkisten tietovarantojen avaamista. Siinäkin riittää pääkaupunkiseudulla työsarkaa tuleviksi vuosiksi. Lisää uutta raaka-ainetta on siis luvassa Tjukanovin ja muiden hyödyntäjien iloksi.

 

 

Toukokuussa 2018 Topi Tjukanov puhui visualisoinneistaan Pariisin OPENVIS-konferenssissa.