Tietopaketti datajournalismista

Datajournalismi (data driven journalism) on journalistinen prosessi, jossa uutisia ja artikkeleja tuotetaan laajoja tietoaineistoja yhdistelemällä, suodattamalla, analysoimalla ja visualisoimalla. Journalistiopiskelija Jasmina Savolainen on koostanut tietopaketin, joka johdattaa lukijansa datajournalismin maailmaan datajournalismi-aiheisten linkkien, työkalujen ja visualisointiesimerkkien kautta.

Linkkejä datajournalismi-aiheisille sivuille

Datajournalismin ja avoimen datan käytön opettelu kannattaa aloittaa tutkimalla, millaista tietoa aiheesta löytyy verkosta. Alle on koottu selkeitä ja mielenkiintoisia sivuja, joiden avulla datajournalismi hahmottuu ihan jokaiselle.

Hyvä johdanto datajournalismiin on myös HRI:ssä joulukuussa 2013 julkaistu Jasmina Savolaisen Rivitoimittajasta avoimen datan asiantuntijaksi – Tavoitteena jokamiehen datajournalismi -blogisarja:

Myös Stadi.TV:n Avoin Data -kanavalle on kerätty inspiroivia avointa dataa käsitteleviä videoita (Päivitys 12/2017: Linkki poistettu).

Työkaluja datavisualisointien tekoon

Datavisualisoinnin opettelu on helppoa. Teorian opettelun rinnalla kannattaa helppokäyttöisillä visualisointityökaluilla kokeilu ja leikkiminen aloittaa jo mahdollisimman aikaisin. Tekemällä oppi parhaiten.

Jos eteen tulee kompastuskiviä, ongelman googlaamalla vastaus löytyy nopeasti. Luultavasti moni muukin on visualisoinnin alkutaipaleella törmännyt samanlaisiin pulmiin.

Alle on listattu työkaluja, joihin tutustumalla datavisualisointitaidot kehittyvät nopeasti.

  • Microsoft Excel – Taulukkolaskentaohjelma, jonka hyvä hallinta on datankäsittelyn edellytys.
  • infogr.am – Helppo työkalu erilaisten infografiikoiden tekoon.
  • Many Eyes – Hieman kömpelö ja jäykkä työkalu datavisualisointien tekoon. Kuitenkin helppokäyttöinen ja toimiva pienten datakokonaisuuksien visualisoimiseen.
  • Tableau Public – Monipuolinen datavisualisointityökalu. Ennen käyttöä kannattaa katsoa muutama tutoriaali ohjelman käytöstä. Loppupeleissä silti melko yksinkertainen. Edellyttää ohjelman lataamista tietokoneelle. Toimii toistaiseksi vain Windows-käyttöjärjestelmillä.
  • Google Fusion Tables – Todella helppo ja nopea tapa käsitellä dataa ja visualisoida se. Interaktiivisten karttojen teko onnistuu nopeasti ja vähällä vaivalla. Ehdottomasti jokaisen datavisualisoijan perustyökalu.

 

Visualisointiesimerkkejä

Rivitoimittajasta avoimen datan asiantuntijaksi – Tavoitteena jokamiehen datajournalismiblogisarjan lopputuotteena syntyi yksinkertaisia datavisualisointeja.

Helsingin yli 95-vuotiaiden määrän ennuste suurpiireittäin

Työkalu: Many Eyes
Data: Pääkaupunkiseudun väestöennuste
Suora linkki visualisointiin: Helsingin yli 95-vuotiaiden määrän ennuste suurpiireittäin

Tekijän kommentti: Tämä oli ensimmäinen tekemäni datavisualisointi. Pyrkimyksenäni oli yksinkertaisesti saada datasta tehtyä jonkinlainen visualisointi. Sisällöllä ja esitystavalla ei niinkään ollut tässä kohtaa väliä. Ensimmäinen haaste oli käytettävän datan poimiminen valitsemani datapaketin joukosta. Koska tavoitteet olivat yksinkertaiset, päätin, että käytettävän datankin tulee olla pelkistetty. Valitsin siis väestöennusteen joukosta yli 95-vuotiaat. Datan siivoamisen ja karsimisen jälkeen itse visualisoinnin tekeminen oli helppoa. Muutaman klikkauksen jälkeen olin tehnyt Many Eyesin avulla ensimmäisen datavisualisointini.

Selvitettyihin rikoksiin syylliseksi epäillyt henkilöt

Työkalu: infogr.am
Data: Naiset ja miehet Helsingissä, osa Oikeuslaitos
Suora linkki visualisointiin:Selvitettyihin rikoksiin syylliseksi epäillyt henkilöt

Tekijän kommentti: Toinen tekemäni visualisointi oli sisällöllisesti jo kiinnostavampi. Valittu esitystapa selventää hyvin naisten ja miesten eroja rikoksentekijöinä. Lukujen tai prosenttiosuuksien vertailun sijaan tämä esitystapa kertoo katsojalle välittömästi näiden kahden muuttujan välisen suhteen.

Kunnallisvaalit Helsingissä

Työkalu: infogr.am
Data: Naiset ja miehet Helsingissä, osa Vaalit
Suora linkki visualisointiin: Kunnallisvaalit Helsingissä

Tekijän kommentti: Kolmas datavisualisointini havainnollistaa samalla useita asioita. Ylemmässä visualisoinnissa katsoja näkee ensin eri puolueiden väliset suhteet ehdokasmäärässä. Klikkaamalla visualisoinnin yläreunasta jotain toista muuttujaa, katsoja voi vertailla kuinka puolueiden suhteet muuttuvat. Alemmassa visualisoinnissa  vertaillaan esimerkiksi äänestäjien sukupuolijakaumaa eri vuosina.

Terassit ja Hesburgerit Helsingin alueella

(Päivitys 12/2017: Linkki poistettu).

Työkalut: Google Fusion Tables ja Scraper Chrome Extension
Data: Terassit Helsingin yleisillä alueilla ja Hesburger-ravintolat
Suora linkki visualisointiin:(Päivitys 12/2017: Linkki poistettu).
Terassit ja Hesburgerit Helsingin alueella

Tekijän kommentti: Tämän visualisoinnin pyrkimyksenä oli opetella interaktiivisen kartan tekeminen Google Fusion Tablesilla ja ruudun raavinnan opettelu Scraper Chrome Extensionilla. Sisällöllisesti tämä visualisointi on hassuttelu. Kartalle on sijoitettu Helsingin alueen terassit ja Hesburgerit. Jos siis haluaa ensi kesänä terassituokion jälkeen hakea iltapalaa Hesburgerilta, tämän kartan avulla on helppo valita sopiva terassi. Helsingin Hesburgerien osoitteet raavin Hesburgerin nettisivuilta.

Pohjoismaisten suurkaupunkien pinta-ala ja väestöntiheys (2011)

Data: Helsinki: Pohjoismaiset suurkaupungit 2012
Työkalu: Google Charts

Tekijän kommentti: Tässä visualisoinnissa tavoitteenani oli oppia ymmärtämään html- ja javascript-ohjelmointia. Google Code Playground -sivustolta löytyy esimerkkejä visualisointien koodeista. Näitä koodeja muokkaamalla pystyy helposti tekemään omia visualisointeja.

Alkuun pääseminen oli melko hankalaa ja perusasioiden sisäistäminen vaati paljon googlailua. Koodariystävistä on tässä kohtaa paljon hyötyä. Ohjelmoinnin opettelu on pitkä prosessi, mutta jo pelkkä koodin ymmärtäminen avaa monia uusia visualisointimahdollisuuksia.

Tekstin kirjoittaja ja Datajournalismi-tietopaketin tekijä Jasmina Savolainen on avoimeen dataan hurahtanut monimediatoimittaja. Hän opiskelee neljättä vuotta journalismia Turun Ammattikorkeakoulussa. Savolainen etsii datakokeiluidensa kautta uusia oivalluksia toimittajan työhön ja toivoo samalla avaavansa avoimen datan mahdollisuuksia myös muille.