Verottajan ensimmäistä data-avausta ladataan ahkerasti

Suomen 300 000 yrityksen, yhdistyksen ja säätiön vuonna 2011 maksamat yhteisöverot julkaistiin viime marraskuussa ensi kertaa avoimena datana.

Valokuva kannettavan näytöstä, jossa selataan juuri avattuja verotietoja.Joulun alla Verohallinnon ylitarkastaja Johanna Kotipelto ei pystynyt keskittymään juhlavalmisteluihin. ”Mietin sen sijaan, kenelle HRI:n datakatalogiin juuri lisättyä yhteisöverodataa koskevat kyselyt pitäisi verohallinnossa ohjata”, hän nauraa.

Verohallinnon historian ensimmäinen data-avaus kiinnostaa muitakin kuin sen tehneitä viranhaltijoita. Tiedoston 300 000 riviä kertovat, paljonko suomalaiset yritykset ja yhteisöt ovat maksaneet veroja vuoden 2011 aikana. ”Tiedostoa ladattiin verohallinnon sivuilta marraskuussa 1 300 kertaa ja joulukuussa 700 kertaa”, Kotipelto kertoo.

Kun Helsingin Sanomat syyskuussa 2012 uutisoi suuryrityksistä, jotka maksavat tuloksestaan keskimäärin vain 5 prosenttia veroa, lähti toimittaja hakemaan tietoja maksetuista yhteisöveroista verotoimiston yleisöpäätteeltä. Juttujen herättämä keskustelu yritysten veronmaksuhalukkuudesta sai vauhtia hallitusohjelmaankin kirjattuun tavoitteeseen edistää valtionhallinnon datavarantojen avaamista. Valtiovarainministeri Jutta Urpilaisen toiveesta tiedot julkaistiin pikavauhdilla Verohallinnon omilla verkkosivuilla heti verotuksen valmistuttua marraskuun alussa.

Ministerin pyyntö sai vauhtia myös Verohallinnon säästöliekillä olleeseen omaan datanavaushankkeeseen. ”Meillä oli käynnistymässä pilottiprojekti, jonka tarkoituksena oli katsoa, mitä tietoja ensimmäisenä avattaisiin”, Kotipelto kertoo.

Verottaja ei ole ollut julkishallinnon datanavaustalkoiden eturintamassa – aivan ymmärrettävistä syistä. ”Verotiedot ovat yleisestä asiakirjajulkisuudesta poiketen salassa pidettäviä tietoja. Laissa mainitaan erikseen, mitkä verotiedot ovat julkisia.”

Lisää verodataa tulossa

Avattavaksi on esitetty muitakin Verohallinnon julkisia tietoja, kuten vuosittaiset verotuksen parametritiedot: esimerkiksi kuntaveroprosentit, pääomatulojen veroprosentit, työnantajamaksujen suuruudet. Kiinnostavaa dataa olisi myös, miten yksittäisen yrityksen verot jakautuvat eri kuntiin. Sen julkaiseminen avoimena datana vaatii tosin lainmuutoksen. ”Nämä kohdentamisperusteet eivät valitettavasti ole julkista tietoa. Mutta ne antaisivat aivan uudenlaisen näkymän kuntatalouteen.”

Keväällä 2013 yhteisöverouutisen tekeminen onkin paljon helpompaa. Kuka tahansa voi ladata koko maan yhteisöverotiedot yhtenä csv-tiedostona ja tutkia, miten paljon tietty yritys tai yhdistys on edellisenä vuonna veroja maksanut. Varsinaisen julkistuksen jälkeen Kotipelto suunnitteli data-aineiston lisensioinnin ja lisäsi tiedot julkisiin datakatalogeihin. Työtä helpotti Johanna Kotipellon lokakuussa 2012 käymä, HRI:n järjestämä datan avaamisen pilottikurssi, joka oli Suomessa ensimmäisen laatuaan. ”Siellä näin, miten datan avaaminen tehdään käytännössä, SQL-tietokantapoiminnasta aina ladattavaksi csv-tiedostoksi.”

”Lataustilastotkin todistavat, että tämä on kiinnostavaa tietoa.”

Mikä oli tärkein oppi ensimmäisestä data-avauksesta? ”Varmaan se, että lataustilastotkin todistavat, että tämä on kiinnostavaa tietoa. Samalla syntyi ymmärrys siitä, mitä kaikkea pitää tehdä ennen kuin tieto on avoimena datana kaikkien saatavilla.”

Kotipelto toivoo, että into avata dataa leviää laajemminkin valtionhallintoon. Yhdistelemällä eri datalähteitä päästään kiinnostavien asioiden äärelle. Journalisteja kiinnostavaa tietoa on kosolti esimerkiksi kaupparekisterissä, mutta toistaiseksi maksumuurin takana. ”Kaupparekisteriin toimitetut tilinpäätökset kertovat paljon enemmän yritysten taloudellisen vastuun kannosta kuin verotuksen tilannekatsaus”, Kotipelto pohtii.

Johanna Kotipellon blogi datanavauskokemuksista: http://avaadataa.blogspot.fi/