HRI:n käyttäjäkysely 2022: “HRI on maailman paras avoimen datan palvelu!”

Pääkaupunkiseudun kaupunkien ja kuntayhtymien julkaisemaa avointa dataa kiiteltiin alkuvuodesta 2022 tekemässämme käyttäjäkyselyssä. Kuitenkin myös parantamisen varaa on: käyttäjät toivoivat datojen parempaa löydettävyyttä ja lisää käyttöesimerkkejä. Dataa oli hyödynnetty mm. visualisointeihin ja liiketoiminnan kehittämiseen. HRI:n perinteinen käyttäjäkysely oli vastattavissa helmikuun ajan, ja saimme 24 vastausta. Kiitos kaikille vastanneille!

HRI:n käyttäjäkyselyjen vastaukset on nyt julkaistu avoimena datana, eli kuka tahansa pääsee halutessaan kaivelemaan vastauksia. Data: Pääkaupunkiseudun avoimen datan palvelun käyttäjäkyselyn vastaukset.

HRI:n kolmatta kertaa tehty vuosittainen käyttäjäkysely oli vastattavissa koko helmikuun. Verkkokyselyä mainostettiin hri.fi:n artikkelilla sekä HRI:n some-kanavilla. Yhteystietonsa antaneiden vastaajien kesken arvottiin kaksi HRI-pakettia, jotka sisälsivät pääkaupunkiseudun avointa ortoilmakuvaa hyödyntävän sateenvarjon ja HRI-kangaskassin.

Lähes jokainen vastaaja kertoi hyödyntäneensä hri.fi-palvelusta löytyvää avointa dataa. Suurin osa vastaajista kertoi hyödyntävänsä avointa dataa harrastajana tai datasta kiinnostuneen henkilön roolissa (16 vastaajaa). Vastaajien joukossa oli julkishallinnon työntekijöitä (8), yritysten työntekijöitä (6), tutkijoita (6), opiskelijoita (4) ja korkeakoulujen työntekijöitä (2). Vastaajat saivat valita useita rooleja.

Eniten pk-seudun avointa dataa oli hyödynnetty kyselyn vastaajien keskuudessa yksittäisen tarvittavan tiedon hakuun (14 vastaajaa) ja visualisointiin (12). Dataa oli myös hyödynnetty erilaisten palveluiden kautta (9); sen avulla oli kehitetty liiketoimintaa (6); ja käytetty muilla erikseen määrittelemättömillä tavoilla (5). Avoin data oli päässyt osaksi myös tutkimusta (4), toiminnan kehittämistä (4) sekä jopa auttanut uuden liiketoiminnan kehittämistä (1).

Vastaajat olivat hyödyntäneet kaikkien 12 datakategorian dataa. Eniten vastaajat olivat hyödyntäneet dataa kategorioista kartat, liikenne ja matkailu, rakennettu ympäristö, asuminen ja väestö.

Mieluisimpia dataformaatteja vastaajille olivat taulukkomuotoiset tiedostot XLS/CSV (14 vastaajaa), paikkatietorajapinnat WFS/WMS (13), rajapinnoista tuttu JSON (9), paikkatietotiedosto SHP (7) ja erilaiset kuvatiedostot (5). Vastaajat olivat käyttäneet myös perinteisiä tiedostoformaatteja kuten XML (3) tai paikkatietotiedosto TAB (2).

Kuvaaja avoimen datan käyttökohteista. Sisältö on avattu leipätekstissä.
Kyselyn vastaajien avoimen datan käyttökohteet.

“Löydettävyys, läpinäkyvyys, luotettavuus!”

Vaikka monen vastaajan terveiset HRI-palvelulle olivat kiittäviä ja kehuvia, löysivät he palvelusta kuitenkin vielä parannettavaa.

Useampi vastaaja tunnisti tarpeen avoimesta datasta tehdyille esimerkeille: niiden avulla voidaan näyttää, mitä hyötyä avoimesta datasta voi olla. Tietoomme tulleita esimerkkejä on koottu sovellusgalleriaan, ja esimerkkejä nostetaan esiin myös HRI:n some-kanavissa ja uutiskirjeessä.

Muutama vastaaja koki datan löytämisen haastavaksi. Pyrimme jatkuvasti parantamaan datan löydettävyyttä mahdollisimman tarkoilla metatiedoilla ja synonyymisanastoilla. Lisäksi portaalin datahaun oletustoimintalogiikkaa säädettiin alkuvuodesta niin, että parhaiten hakusanoja vastaavat tulokset ovat hakutuloslistauksen kärjessä. Myös erään vastaajan toivoma läpinäkyvyys ja luotettavuus paranevat mahdollisimman tarkoista ja kattavista metatiedoista huolehtimisella. Lisäksi tänä vuonna kaikkien datojen metatietokuvaukset käännätetään englanniksi.

Kolme eri vastaajaa pyysi palautteessaan HRI-palvelua huolehtimaan siitä, että rajapintojen lisäksi julkaistaan samaa dataa tiedostomuodoissa (esim. CSV, XLSX, SHP, TAB). Dataa avataan nykyään enenevissä määrin ohjelmointirajapintojen kautta. Rajapintoja hyödyntävät etenkin sovelluskehittäjät ja koodaustaitoiset. Rajapintojen ylläpito on usein vaivattomampaa kuin tiedostojen, ja data on aina yhtä ajan tasalla kuin tietokannassakin. Rajapintojen monista hyödyistä huolimatta tunnistamme vastaajien huolen siitä, että jos data on saatavilla ainoastaan rajapinnasta, on se vaikeasti käytettävää osalle käyttäjistä. Olemmekin pyrkineet vastaamaan haasteeseen mm. teettämällä Datasette-nimisen työkalun, jolla voi tarkastella Palvelukartan REST-rajapinnan sisältöä selaimessa visuaalisesti taulukossa ja ladata dataa CSV- tai JSON-tiedostoina. Pääset tutustumaan työkaluun tästä linkistä.

Tiedostomuotojen monipuolisuuden lisäksi yksi vastaaja toivoi myös monipuolisempia koordinaatistovaihtoehtoja paikkatietoaineistoille. Tiedostomuotoiset paikkatietoaineistot ovat useimmiten tarjolla vain yhdessä koordinaatistossa (usein paikallinen ylläpitokoordinaatisto), mutta sama aineisto on yleensä saatavilla useammassa koordinaatistossa paikkatietorajapinnassa. Tuetut koordinaatistot näkee rajapinnan getCapabilities-kyselyllä (esim. Helsingin WFS-rajapinta), ja ohjeistusta rajapinnan käyttöön on koottu tähän dokumenttiin.

Eräs vastaaja toivoi sitä, että dataa päivitettäessä aikaisempaa julkaisua ei poistettaisi, jolloin datan aikasarja säilyisi. Näin toimitaankin suurimman osan datoista kohdalla: uusi päivitys sisältää aikaisemman aikasarjan, johon on vain lisätty viimeisin tarkastelukausi. Ajallisen kattavuuden lisäksi eräs vastaaja toivoi datojen sisällöllistä laajentamista pääkaupunkiseudun naapurikuntiin.

Vastaajien datatoiveet

Kyselyn vastaajat esittivät monia datatoiveita uusia data-avauksia ajatellen. Muutamat toiveista olivat yleisemmällä tasolla (“koulutustietoja, terveystilastotietoa, tilastoja säästä ja ilmastosta”, “enemmän paikkatietodataa”), mutta moni esitetty toive oli yksityiskohtainen.

Pääkaupunkiseudun kaupunkien tai kuntayhtymien dataan liittyviä toiveita olivat:

  • kirjaston lainatuimmat kirjat lainaajien postinumeroalueittain
  • joukkoliikenteen nousijamäärät tarkalla tasolla, esim. päivätaso, pysäkeittäin
  • kaupunkien hallintoelinten päätökset hyvällä asiahaulla varustettuna (vrt. paatokset.hel.fi)
  • koulujen oppilaiden poissaolot anonyyminä summatietoina päivittäin/tunneittain
  • julkisessa liikenteessä tehdyt matkat riviaineistona

Osa toivotuista aineistoista ei ole pk-seudun kuntien tai kuntayhtymien hallussa ja avattavissa. Näitä datatoiveita olivat:

  • Mobiilidataan perustuva paikannusdata
  • Ympäristöministeriön vähittäiskaupat-aineisto ja muut yritysten toimipisteet sisältävät aineistot, Tilastokeskuksen Ruututietokanta, Ruokaviraston VATI-järjestelmän data, maataloustukien myönnöt (EU + kansalliset), asuntojen kauppahintatiedot suoraan varainsiirtoveron perusteella (laajempi aineisto kuin YM:n julkaisema), Tullin tekemät takavarikot, Finavian yksityiskohtaiset tiedot lentoliikenteestä, Fingridin yksityiskohtainen data sähkön tuotannosta, kulutuksesta ja siirrosta ym.

Lähdemme innolla jäljittämään toivottuja datoja ja selvittämään, olisiko niitä mahdollista avata laajemmalle yleisölle.