Ylen datajutut syntyvät tekstieditorilla, taulukkolaskennalla ja Pythonilla

Valokuva Teemo Tebestistä.
Työ Ylen datajournalistina on opettanut Teemo Tebestille paljon käyttöliittymien suunnittelusta ja siitä, miten ihmiset tekevät havaintoja maailmasta. Pelkillä koodaustaidoilla ei pärjää. “Tämä työ vaatii ehdottomasti kiinnostusta yhteiskunnallisiin asioihin.”

Ylen koodaava toimittaja Teemo Tebest pärjää yksinkertaisilla työkaluilla. Eniten ruudulla on avoinna koodaajien suosima Sublime Text -editori.

Kun rivitoimittajan datankäsittelytaidot loppuvat, tulevat apuun Ylen Plus-deskin koodaajat ja graafikot. 8-henkisestä yksiköstä löytyy osaamista niin datajournalismin, interaktiivisten verkkojuttujen kuin visuaalisten feature-juttujen tekoon. “Jos teemme juttua vaikka USA:n presidentinvaaleista, tiimissä on yleensä yksi substanssiosaaja ulkomaantoimituksesta, meiltä taas graafikko ja koodaava toimittaja”, kertoo Teemo Tebest.

Juuri nyt Tebestin käsissä on THL:n aineisto siitä, miten suuri osa vuonna 2015 syntyneistä on rokotettu Suomen eri kunnissa. Tebest miettii, miten Oulun aluetoimituksen juttua rokotuskattavuudesta voisi datan avulla tehdä entistä kiinnostavammaksi.

Datavarantojen kääntäminen ihmisiä kiinnostaviksi tarinoiksi ei ole aivan helppoa. “Vaarana on, että haluaa julkaista kaiken: rakentaa hienon käyttöliittymän ja olettaa, että ihmiset innostuvat penkomaan sitä”, Tebest kuvailee datajournalistin yleisintä sudenkuoppaa.

Datajutussa pätevät kuitenkin samat lainalaisuudet kuin perusuutisessa. Keep it simple stupid -periaate pätee myös datajournalismissa. “Lukijan puolesta pitää tehdä paljon valintoja.”

Käyttöliittymiä dataan

Teemo Tebest avaa näytölle HRI:n kautta avatusta datasta syntyneen jutun pääkaupunkiseudun asuinalueiden ikääntymisestä. Helsingin seutu vanhenee vauhdilla -jutun interaktiivinen kartta näyttää, miten Helsingin eri kaupunginosien ikäjakauma on muuttunut sitten vuoden 1962. 1960-luvulla uusien asuinalueiden väestöstä yli puolet saattoi olla alle 19-vuotiaita, nyt nämäkin lähiöt ovat harmaantuneet. “Tässä teimme käyttöliittymän HRI:ssa olevaan avoimeen dataan”, Tebest kertoo.

Kuvakaappaus Kuntatutka-jutusta.
Vuoden 2017 kuntavaaleihin Teemo Tebest rakensi Suomen kuntien tähtiluokituksen, joka kiteyttää kymmenet tilastomuuttujat kunnan taloutta, elinvoimaa, terveyttä ja ilmapiiriä kuvaaviksi tähdiksi. Kuntatutkan perusdata avattiin kaikkien käyttöön, joten kuka vain voi analysoida samaa dataa omilla menetelmillään. Kuva: yle.fi/uutiset
Kuvaaja metron täyttöasteesta. Keskustassa sijaitsevien asemien välillä istumapaikkoja on vähiten tarjolla.
Marraskuussa 2018 keskusteltiin Helsingin metron ruuhkista. Plus-deskin animaatio paljastaa, että ruuhka-aikoina istumapaikka on kiven alla, mutta ruuhkaisimpiinkin vuoroihin mahtuisi vielä paljon lisää matkustajia. Kuva: yle.fi/uutiset

Käyttöliittymien suunnittelu on datajournalistin perustyötä. Excel-tiedostosta muutoksia pystyy havainnoimaan vain rutinoitunut tilastotieteilijä, selkeä visuaalinen esitys samasta aiheesta taas avautuu kenelle tahansa yhdellä silmäyksellä.

Volkswagenin dieselmallien päästöhuijauksen paljastuttua Plus-deskissä tehtiin Helsingin seudun päästötietoihin pohjautuva kartta typpioksidipäästöistä. Erityisesti dieselmoottoreita vaivaavat typpipäästöt ovat kartan mukaan suurimmillaan ydinkeskustassa, kehäteillä ja lentoaseman ympäristössä. ”Pyrimme löytämään datasettiin aina sellaisen näkökulman, joka kiinnostaa lukijoitamme juuri sillä hetkellä.“

Teemo Tebest kaivaa laukustaan laturin ja kytkee Macin laturiin. Kuuden vuoden ikäisen työhevosen akku alkaa olla ehtoopuolella. “Aika paljon tulee tehtyä hommia terminaalilla”, Tebest kertoo.

Vanhalle Linux-käyttäjälle Macin komentorivi on kotoisa ympäristö. Tekstieditorina Tebest käyttää Sublime Textiä, jonka pelkistetty käyttöliittymä on rakennettu koodaajien tarpeisiin.

Datan käsittelyssä eniten käytössä on taulukkolaskentaohjelma Google Sheets, jota käyttävät kaikki Ylen toimittajat. Kun tarvitaan monimutkaisempia analyyseja tai halutaan vaikkapa hankkia dataa verkosta ja luoda siitä oma tietokanta, ottaa Tebest avuksi Python-ohjelmointikielen. “Python on hyvä koodikieli tällaisten loogisten ajojen tekemiseen. Jos esimerkiksi haluaa hakea asuntojen vuokrauspalveluista kaikki tarjolla olevat asunnot, Python säästää paljolta käsityöltä.”

Tinder kansanedustajaehdokkaille

Tebestillä on takanaan jo kuusi työvuotta Ylen datajournalistina. Uran suosikkijuttu on vuoden 2015 eduskuntavaaleihin rakennettu vaalikone Kandideitti, josta Tebest kollegoineen pokkasi myös pohjoismaisen datajournalismipalkinnon.

“Vaalikoneet ovat jo vanha keksintö, mutta halusimme uudistaa vähän konseptia, koska niin moni ei jaksa vastata vaalikoneiden kymmeniin kysymyksiin.” Kandideitti toi maailman suosituimman deittisovellus Tinderin perusajatukset, nopeuden ja ulkonäkökeskeisyyden, eduskuntavaaliehdokkaan valintaan.

Tebest klikkailee nopeasti mitä mieltä on ydinvoimasta, tuloverojen alentamisesta, sukupuolineutraalista avioliitosta, viineistä ruokakaupoissa ja ruotsinopetuksen vapaaehtoisuudesta. Ruudulle lävähtää ensimmäinen ehdokas, mutta hänestä kerrotaan kuvan lisäksi vain etunimi ja ikä. “Mä tykkäsin Jaanasta, mutta hän ei näköjään tykännyt minusta, ei tullut matchia.” Seuraava ehdokas ilmestyy ruudulle. Tällä kertaa molemmat tykkäävät toisistaan. “Me olimme samaa mieltä vähintään kolmesta asiakysymyksestä”, Tebest kertoo.

Ehdokkaan tarkempi esittely puoluekantoineen ilmestyy ruudulle, ja Kandideitin käyttäjä pääsee tutustumaan myös ehdokkaan vastauksiin Ylen “oikeassa” vaalikoneessa.

Kuka?

Teemo Tebest s.1984

Koulutus Diplomi-insinööri, tietotekniikka
Työpaikka Yle Plus-deski, koodaava toimittaja

Avoimen datan suosikkityökalut

  1. Sublime Text -tekstieditori “Sitä tulee käytettyä eniten.”
  2. Taulukkolaskentaohjelmisto “Meillä on käytössä Google Sheets.”
  3. Python “Pythonia tarvitaan, kun halutaan tehdä monimutkaisempaa analyysia.”

Mitä tehnyt avoimella datalla

Arkityönä datajuttuja Ylen verkkopalveluun. Tebestin datajournalismi.blogspot.com-blogi on Suomen seuratuimpia alallaan. Toteuttanut avoimia tietoaineistoja hyödyntävän, musiikinkuuntelua tilastoivan statster.info verkkopalvelun.

Mac, Windows vai Linux

Mac “Linux-taustan takia se on hyvä ympäristö, mutta kotoa löytyy myös kolme eri Linuxia.”

Terveiset HRI:lle

“Kun pidän koulutuksia Ylen toimittajille, käy ilmi, että liian harva tietää HRI-palvelusta. Miten madaltaa raja-aitaa niin, että ihmiset, jotka tietävät kaiken vaikkapa sote-uudistuksesta, mutta pelkäävät Excelin käyttöä, saataisiin tarttumaan dataan? Pitäisikö HRI:n järjestää heille koulutusta tai jalkautua organisaatioihin?“

Kotisivu http://teelmo.info/

Tutkijasta toimittajaksi

Miten tietotekniikan diplomi-insinööri päätyi toimittajaksi? Tebest innostui datajournalismista tehdessään jatko-opintoja informaation visualisoinnista Tampereen teknillisessä yliopistossa. “Vuonna 2011 Tampereella järjestettiin datajournalismin päivät, jonka työpajassa pengottiin Tampereen kaupungin päätösdataa”, Tebest muistelee.

Innostuksen siemen oli kylvetty, ja Tebest aloitti datajournalismi-bloginsa kirjoittamisen. Kun ruotsinkieliseen Yleen vuonna 2012 haettiin julkaisujärjestelmän kehittäjää, päätti Tebest koettaa onneaan ja pääsi töihin. “Tein siellä vuoden aikana myös muutaman journalistisen projektin. Tutkimme muun muassa perussuomalaisten kytköksiä äärijärjestöihin ja sitä missä myydään eniten alkoholia per asukas.”

Kun sana koodaustaitoisesta kaverista levisi, alkoi Tebestille tulla yhteydenottoja oman toimituksen ulkopuolelta. “Sitten vaan tehtiin datajuttuja, aika paljon omalla vapaa-ajalla. Olin tosi innostunut.” Vuoden 2013 alussa Yle perusti Plus-deskin, ja Teemo Tebest päätyi tiimiin tekemään datajournalismia päätyönään.

Monissa medioissa datadeski on oma tiiminsä, joka tekee töitä enimmäkseen keskenään. “Meillä Ylessä on sellainen näkökulma, että haluamme koko organisaation mukaan verkon kehittämiseen.” Ideoita datajuttuihin pyritään hankkimaan talon kaikista toimituksista. “Toimittajat sitoutuvat paremmin, kun ideat ovat heidän omiaan.”

Tämän takia Tebest kiertää eri toimituksissa kouluttamassa ihmisiä datankäsittelyn saloihin. Edellisviikon koulutuksessa istui pääkaupunkiseutua seuraava metropolitoimitus, aiheena olivat HRI-palvelun datasisällöt. “Kävimme läpi HRI-palvelua, miten sieltä tuodaan dataa Exceliin, miten PC-Axis-tiedostot avataan”, Tebest kertoo.

Tebestin mukaan Suomessa datajournalistilla on hyvät oltavat, sillä avointa dataa on hyvin saatavilla. Ruokahalu tosin kasvaa syödessä. Esimerkiksi kaupparekisteritietojen, kiinteistöjen omistustietojen ja myytyjen asuntojen hintatietojen avaaminen ovat Tebestin toivelistalla. Moni datajuttu hyödyntää Tilastokeskuksen postinumeroalueittain julkaistua dataa.

Pääkaupunkiseudulla Tebest toivoisi datan julkaisua kaupunginosittain. “Voisimme kertoa lukijoille datatarinoita juuri siitä kaupunginosasta, johon he tuntevat kuuluvansa, ei jostain absurdista postinumeroalueesta.”

Vuonna 2013 perustettu Ylen Plus-deski on selvästi onnistunut tekemään asioita oikein. Siitä kertoo toistakymmentä palkintoa ansiokkaista datajutuista – ja se tosiseikka, että yksikkö on edelleen olemassa. Koko Ylen organisaatio kun on ehditty uudistaa jo pariin otteeseen Plus-deskin historian aikana. Yli 200 juttua päivässä suoltava uutisorganisaatio on varsin hektinen työpaikka. Datatoimituksessa ehtii kuitenkin keskittyä juttuaiheisiin. “Harvassa toimituksessa tehdään kahden viikon juttuprojekteja”, Tebest kertoo.