Avoimen datan sanasto

API, CKAN, CC 4.0, WFS? Metadata, dataformaatti, omadata?! Avoimen datan maailmassakin vilisee paljon termejä, jotka saavat välillä kokeneemmankin konkarin pään pyörälle. Tähän avoimen datan sanastoon on koottu alan keskeisimpiä termejä selityksineen. Avoimen datan termejä on koottu myös kansalliseen Tiedon jakamisen toimintamallin sanastoon.

Anonymisointi Tunnistetietojen poistaminen tai muuntaminen siten, että henkilöiden tunnistaminen ei enää onnistu eikä henkilöitä voi identifioida. Tunnistetietoja ovat esimerkiksi nimet, osoitteet, puhelinnumerot tai henkilötunnukset.)

Rajapinnan eli API:n toiminta: rajapinnan kautta voi lukea tietoa taustajärjestelmästä mobiili- ja verkkosovelluksiin, jota loppukäyttäjät käyttävät.
API. Lähde: kentosystems.com.

API (Application programming interface, API) eli ohjelmointirajapinta on määritelmä, jonka mukaan eri ohjelmat voivat tehdä pyyntöjä ja vaihtaa tietoja eli keskustella keskenään. (Lähde: Wikipedia.)

Avoin data (open data) Avoimella datalla tarkoitetaan julkishallinnon, organisaatioiden tai yritysten tuottamaa tai niille kertynyttä julkista tietoa, joka on avattu rakenteisessa muodossa vapaasti ja maksutta kaikkien hyödynnettäväksi. Data on digitaalista raaka-ainetta: mm. tilastoja, taloustietoja, karttoja, kuvia, videotallenteita tai 3D-malleja.

Avoin lisenssi (open license) Käyttölupa, joka sallii aineiston vapaan levittämisen, muokkauksen ja käytön, myös kaupalliseen tarkoituksiin. Suomessa julkishallinnon avaamien tietoaineistojen käyttöluvaksi suositellaan Creative Commons Nimeä 4.0 (CC BY 4.0) -käyttölupaa, josta on annettu JHS-suositus 189 Avoimen tietoaineiston käyttölupa.

Avoin lähdekoodi (open source) tarkoittaa tietokoneohjelmien avoimia tuottamis- ja kehitysmenetelmiä, jotka tarjoavat käyttäjälle mahdollisuuden tutustua ohjelman lähdekoodiin ja muokata sitä omien tarpeidensa mukaisesti. Avoimen lähdekoodin periaatteisiin kuuluu myös vapaus käyttää ohjelmaa mihin tahansa tarkoitukseen ja kopioida ja levittää sekä alkuperäistä että muokattua versiota. (Lähde: Wikipedia.)

Avoin rajapinta (open API) Ohjelmointirajapinta, jonka kaikki ominaisuudet ovat julkisia ja jota voi käyttää ilman rajoittavia ehtoja. Avoimen rajapinnan käyttö on maksutonta, eikä käyttäjän tarvitse kysyä lupaa rajapinnan haltijalta tai kertoa etukäteen, mihin tarkoitukseen hän aikoo rajapintaa käyttää. Avoimen rajapinnan rajapintakuvauksen ja dokumentaation tulee olla avoimesti kaikkien saatavilla. Lisäksi rajapinnan tulee olla testattavissa. (Lisätietoja: avoinrajapinta.fi.)

CKAN Open Knowledge Foundationin kehittämä avoimen lähdekoodin tiedonhallintajärjestelmä, joka on suunniteltu erityisesti avoimen datan julkaisemiseen ja hakemiseen. Ks. datakatalogi.

Creative Commons Creative Commons on ei-kaupallinen organisaatio, joka edistää luovuuden ja tiedon jakamista ja käyttöä. CC-lisenssit ovat standardoitu ja kansainvälisesti tunnettu tapa myöntää oikeuksia mm. datan hyödyntämiseen, jatkojalostamiseen ja jakamiseen. Suomessa julkishallinnon avaamien tietoaineistojen käyttöluvaksi suositellaan Creative Commons Nimeä 4.0 (CC BY 4.0) -käyttölupaa.

Kakkuvertauksessa data on raaka-aineita, esim. munia ja jauhoja, informaatio uunista tullut kakku, esitystapa koristeltu kakku ja tieto syöty kakku.
Lähde: epicgraphic.com

Data Koneellisesti käsiteltävässä muodossa olevaa tietoa. Yleiskielessä sanojen data, informaatio (engl. information) ja tieto (engl. knowledge) käytössä ei ole useinkaan selvää eroa. Tieto-sanalla voidaan viitata myös dataan ja informaatioon. (Lähde: Tietotekniikan termitalkoot.)

Dataformaatti (data format) Tiedostomuoto, johon dataa tallennetaan. Ilmaisee tietokoneelle tallennetun tiedoston tallennusmuodon eli rakenteen. Esimerkkejä: CSV, XML. (Lähde: Wikipedia.)

Datakatalogi (data catalog) Verkkopalvelu, johon on koottu avointen tietoaineistojen meta- eli kuvailudatat helposti haettavaan muotoon. HRI:ssa ja monissa muissa avoimen datan palveluissa käytetään CKAN-datakatalogia.

Dataportaali (data portal) Verkkopalvelu, joka sisältää datakatalogin sekä usein myös muuta aihepiiriin liittyvää sisältöä, kuten uutisia, ohjeita, jne.

GitHub GitHub on verkkosivusto, joka tarjoaa paikan Git-versionhallintaa käyttäville ohjelmakehitysprojekteille. Git itsessään on komentoriviohjelma, jolle GitHub tarjoaa graafisen käyttöliittymän. Gitin lisäksi GitHub tarjoaa projekteille toimintoja, kuten bug-trakkerin, kehitystoiveet, tehtävien hallinnan ja wikin. (Lähde: Wikipedia.)

JHS 189 -suositus Julkisen hallinnon suositus avoimen datan lisenssistä. JHS 189 -suosituksen mukaan Suomen julkishallinnon avoimiin tietoaineistoihin suositellaan käyttöluvaksi Creative Commons Nimeä 4.0 -lisenssiä.

Julkisuuslaki eli laki viranomaisten toiminnan julkisuudesta. Julkisuusperiaatteen mukaan viranomaisten asiakirjat ovat julkisia, jollei niiden julkisuutta ole välttämättömien syiden vuoksi lailla erikseen rajoitettu.

Sama data sekä XML- että JSON-muodossa.
Koneluettava data on rakenteisessa, systemaattisessa muodossa. JSON on XML:ää tiiviimpi formaatti ja se on suoraan eri ohjelmointikielien objektien käytettävissä.

Koneluettavuus (machine readability) Koneluettavuus tarkoittaa, että tieto on rakenteistettu systemaattiseen muotoon (esim. JSON, XML, CSV) siten, että kone pystyy käsittelemään tietoja. Esim. PDF-muoto ei ole koneluettava, sillä vaikka ihmisen on helppo lukea sitä, niin koneellisesti sitä ei pysty tulkitsemaan.

Käyttöehdot Ehdot, joiden puitteissa avattua dataa saa käyttää. Esimerkiksi Creative Commons Nimeä (CC BY) -lisenssi edellyttää lähteen nimeämistä, kun taas Creative Commons 0 -lisenssissä ei ole ehtoja ollenkaan.

Käyttölupa Käyttöluvassa määritellään käyttöehdot, joilla avattua dataa saa käyttää. Käyttöluvasta käytetään myös sanaa lisenssi.

Lisenssi Ks. käyttölupa.

Metadata eli metatieto. Tietoa tiedosta, datan kuvailutiedot. Metadatassa kerrotaan datan sisältöä ja rakennetta kuvaavat olennaiset tiedot, joiden pohjalta dataa pystyy hyödyntämään oikein. Metadata mahdollistaa myös aineiston löytämisen datakatalogista erilaisin hakukriteerein.

Ohjelmointirajapinta katso API.

Omadata (MyData) Omadata on henkilötietojen hallinnan ja käsittelyn periaate, jonka mukaan ihmisillä on oltava mahdollisuus hallita, hyödyntää ja luovuttaa eteenpäin heistä kerättäviä henkilötietoja (esim. terveystiedot, energiatiedot tai ostotiedot). Omadata ei ole koskaan avointa dataa. (Lähde: Wikipedia.)

Skeema (schema) Skeeman avulla voidaan esittää määrämuotoisesti esimerkiksi tietomalli. Skeema voi olla esimerkiksi XML-skeema.

Tekijänoikeus Itsenäisen ja omaperäisen teoksen tekijälle syntyy tekijänoikeus, eli tekijällä on yksinoikeus määrätä teoksensa käytöstä. Tekijänoikeus liittyy esim. valokuviin.

Tiedostomuoto Ks. dataformaatti.

Tietoaineisto (dataset; data set) Yksilöitävissä oleva kokoelma tietoa.

Tietomalli Tietomalli kuvaa, mitä tietokenttiä tietoaineistossa on ja miten ne liittyvät toisiinsa. Standardien mukaiset tietomallit parantavat eri tietojärjestelmien yhteentoimivuutta. Avoimia tietomalleja ovat esimerkiksi schema.org ja Popolo.

Tietovaranto Looginen tietoaineistojen kokonaisuus, jota jokin taho hallinnoi.

WFS-rajapinta WFS (Web Feature Service) on standardoitu ohjelmistoriippumaton tekniikka ja rajapinta, jonka kautta paikkatietoaineistoja voidaan jakaa käyttäjille vektorimuodossa aina ajantasaisina. (Lähde: Ohje WFS-rajapinnan käyttöön.)

WMS-rajapinta WMS (Web Map Service) on standardoitu ohjelmistoriippumaton rajapinta, jonka kautta paikkatietoaineistoja voidaan jakaa käyttäjille katselupalveluna (rasterimuoto). WMS-palvelun kautta käytettyinä kartat ovat aina ajan tasalla. Niitä voidaan hyödyntää esimerkiksi taustakarttoina paikkatieto-ohjelmissa. (Lähde: Helsingin kaupunkimittaus.)

Yhteentoimivuus (interoperability) Tietojärjestelmät ovat teknisesti ja tietosisällöllisesti yhteentoimivia muiden tietojärjestelmien kanssa silloin, kun ne pystyvät käyttämään samoja tietoja tai toimivat yhteen rajapinnan kautta tai muulla tavalla.

Yksityisyydensuoja Jokaisella ihmisellä on yksityisyyden suoja. Tietoja, joiden julkaiseminen loukkaa yksityiselämää, voi julkaista vain asianomaisen suostumuksella. Suostumus tarvitaan, jos tietojen julkaiseminen voi aiheuttaa vahinkoa, kärsimystä tai saattaa henkilön halveksunnan kohteeksi. Avoin data ei saa sisältää tunniste- tai henkilötietoja.