Mitä on avoin data?
Avoin data ei ole sama asia kuin julkinen tieto. Julkiseen tietoon kaikilla on pääsy, eli ihmiset pääsevät lukemaan tietoja esimerkiksi verkkosivuilta tai kaupungin kirjaamosta. Avoin julkinen tieto eli avoin data puolestaan tarkoittaa sitä, että kuka tahansa voi käyttää tietoja omiin tarkoituksiinsa tasavertaisesti julkishallinnon kanssa.
Kaupungeilla on valtavasti tietoa vaikkapa liikennemelusta, väestöennusteista, kirjastojen aineistoista tai ravintoloiden terasseista. Kun data on avointa, tietoja voi hyödyntää paljon laajemminkin kuin kaupungin omassa toiminnassa.
Avoimen datan kriteerit
Avoin data on koneluettavassa muodossa olevaa julkista tietoa, jota kuka tahansa voi käyttää vapaasti ja maksutta, myös kaupalliseen käyttöön.
1. Julkisuus
Datan on oltava julkista tietoa, jotta se voidaan avata. Kenenkään yksityisyydensuoja tai yleinen turvallisuus ei saa vaarantua dataa avattaessa. Datassa ei saa olla esimerkiksi henkilötietoja tai liikesalaisuuksia.
2. Koneluettavuus
Data on avattu sellaisessa muodossa, että sitä on helppo käsitellä tietokoneohjelmistoilla. Ihmisen on helppo lukea PDF-dokumenteissa tai HTML-sivuilla olevaa tietoa, mutta sitä on vaikea lukea ohjelmallisesti. Datan koneelliseen tarkasteluun ja hyödyntämiseen sopivat esimerkiksi CSV-, XLS- tai XML-muodot sekä erilaiset rajapinnat suoraan datalähteeseen.
3. Uudelleenkäytön sallivat lisenssiehdot
Lisätietoa
Open Knowledge Foundationin määritelmä avoimelle datalle
Datan hallinnoija sallii avaamansa datan vapaan uudelleenkäytön myös kaupalliseen käyttöön. Tämä käy ilmi avatun datan kuvailutiedoista löytyvistä datan käyttöehdoista eli lisenssistä. Käyttöoikeuksien selvittäminen – käyttöehtojen puuttuessa – voi monesti olla niin työlästä, että datan hyödyntämisestä luovutaan.
4. Maksuttomuus
Avointa dataa voi käyttää maksutta. Maksuttomuus helpottaa erityisesti ensikosketuksen saamista dataan. Se mahdollistaa datan hyödyntämiseen liittyvät kokeilut ilman budjettibyrokratiaa.
Ymmärrettävyys ja löydettävyys
Edellä listattujen neljän kriteerin lisäksi datan rakenne ja merkitys pitää kuvata käyttäjille ymmärrettävästi. Datan kuvailutiedot eli metadata auttaa käyttäjää hahmottamaan ja tulkitsemaan datan sisältöä oikein.
Lisäksi on tärkeää, että avoimet datat löytyvät julkisesta verkosta helposti. Datan löydettävyys paranee, kun se kuvataan julkisiin datakatalogeihin. Pääkaupunkiseudun kaupunkien avaamat datat julkaistaan HRI:n datakatalogissa.
World Wide Webin isä Tim Berners-Lee kertoo kuuluisassa TED-puheessaan helmikuussa 2009, miksi datan avaaminen on WWW:n seuraava iso kehitysaskel.