Historiadatoilla näkymiä menneisyyteen

Valtaosa HRI:n kautta avattavista aineistoista on tuotettu tällä vuosituhannella. Tuoreen kaupunkitiedon lisäksi myös menneisyys kiinnostaa. Millaisia näkymiä avoin data luo historiaan? Entä mihin historiadataa on käytetty?

HRI:n kautta avataan pääosin ajankohtaista tietoa mm. pääkaupunkiseudun kaupunkien taloudesta, väestöstä, päätöksenteosta ja liikenteestä. Tuoreen tiedon lisäksi kaupungeilla on hallussaan myös paljon vanhaa materiaalia – arkistojen aarteita ja pitkiä tilastoaikasarjoja. Myös näitä aineistoja on saatavilla avoimena datana.

Helsinki Loves Developers -kehittäjätapaamisessa to 5.4.2018 esiteltiin kaupunkien historiallisia aineistoja sekä pitkiä aikasarjoja. Esillä oli katsauksia historiaan mm. museoiden, kaupunkien tilastojen sekä kaupunginarkiston näkökulmista.

Pitkiä aikasarjoja ja arkistojen aarteita

Helsingin kaupunginarkisto on digitoinut ja avannut mm. useita vanhoja karttoja Helsingistä.

Historiantutkijalle Helsingin kaupunginarkisto on todellinen aarreaitta. Arkiston vanhin asiakirja on peräisin vuodelta 1569, ja vanhimmat asiakirjasarjat alkavat 1720-luvulta. Kaikkiaan arkistossa on aineistoja noin 16 hyllykilometriä, mikä vastaa matkaa Helsingin rautatieasemalta Tikkurilan asemalle. Valtavasta tietomäärästä on digitoitu vasta Helsingin rautatieaseman laitureiden verran, noin 150 metriä.

Tiedot arkiston kaikista aineistoista löytyvät Helsingin kaupunginarkiston Sinetti-tietokannan kautta, kertoi kaupunginarkiston tutkija Panu Haavisto. Aineistojen perustietojen lisäksi Sinetistä löytyvät arkiston digitoidut aineistot. Arkisto on keskittynyt nyt painettujen asiakirjakokoelmien sekä karttojen ja piirustusten digitoimiseen. Koneella kirjoitetut asiakirjat on digitoitu tekstintunnistuksella, joten niiden sisältöäkin pystyy hakemaan Sinetin kautta. Kartat ja piirustukset puolestaan digitoidaan korkearesoluutioisina. Vaikka digioituja aineistoja on reilusti toista miljoonaa, on digitoituna vasta noin prosentti arkiston koko sisällöstä.

Sinetin sisältö on vapaasti kaikkien käytettävissä. Sinettiin ollaan parastaikaa tekemässä avointa ohjelmointirajapintaa. Rajapinta on tarkoitus julkaista vuoden 2018 aikana.

Jotta pitkiä tilastoaikasarjoja olisi helpompi hyödyntää, on Helsingin tilastollisissa vuosikirjoissa julkaistuja vuosittaisia tilastoja koottu yhteen Aluesarjat-tietokantaan. Aluesarjoista löytyy Helsingin historiallisia tilastoja parhaimmillaan vuodesta 1811 alkaen. Pisimmät historialliset aikasarjat jatkuvat 2000-luvun puolelle. Niistä löytyy tietoa mm. Helsingin väestöstä, rakentamisesta ja työelämästä. Varsinaisten historiallisten tilastojen lisäksi osa Aluesarjojen pääkaupunkiseutua koskevista, vuosittain päivitettävistä tilastoista ulottuu 1960-luvulle saakka, kertoi tutkija Marjo Kaasila Helsingin kaupunginkansliasta.

Koko Aluesarjojen sisältö on julkaistu avoimena datana. Tilastojen metatiedot löytyvät myös HRI:sta. Pc-axis-muotoisten tilastojen lisäksi Aluesarjojen sisältö on saatavissa myös avoimen rajapinnan kautta.

Aluesarjat.fi-tietokanta sisältää niin Helsingin historiallisia tilastoja kuin myös nykypäivään jatkuvia pitkiä aikasarjoja. Asunto- ja rakennustuotannosta sekä väestöstä on saatavissa tietoa aina 1960-luvulta alkaen.

Kaupunginarkistosta paljon tiedusteltujen kouluihin liittyvien tietojen löytymisen helpottamiseksi kaupunginarkisto ja opetustoimi ovat tehneet yhteistyössä Koulurekisterin. Rekisteri sisältää helsinkiläiskoulujen historia- ja nykytietoja, kuten nimet ja sijainnit, kertoi arkistotarkastaja Elena Iso-Pietilä. Tietoa on aina 1550-luvulta alkaen. Koulurekisterin sisältö on avointa dataa ja sen käyttöliittymä avointa lähdekoodia.

Kiehtovia vanhoja valokuvia

Helsinkikuvia.fi-palvelussa on kymmeniä tuhansia vanhoja valokuvia Helsingistä. Kuvat ovat avointa dataa ja itse palvelu on avointa lähdekoodia. Kuvassa on tuntemattoman valokuvaajan ikuistamat kaksi pyöräilijää 1800-luvun lopulta.

Toinen Helsingin historiatiedon aarreaitta on Helsingin kaupunginmuseo. Museon kokoelmiin kuuluu noin 450 000 esinettä postimerkeistä ratikkavaunuihin, miljoona valokuvaa, kuutisen tuhatta taideteosta sekä miltei sata tuhatta arkeologista esinettä. Kokoelmasta on digitoitu jo kymmeniä tuhansia valokuvia ja esineitä.

Kaupunginmuseon tutkija Tuomas Myren kertoo, että museoissa on viime aikoina ollut paradigmamuutos: aiemmin kokoelmia vahdittiin tarkasti ja pelättiin, että niitä käytettäisiin väärin. Nyt taas museoiden digitoituja kokoelmia avataan vapaasti käyttöön, tehdään yhteistyötä ja mahdollistetaan aineistojen laajempaakin käyttöä. Museot toivovat kokoelmistaan syntyvän erityisesti erilaisia verkkosovelluksia.

Metatietoja Helsingin kaupunginmuseon aineistoista on viety kansalliseen Finna-palveluun, josta löytyy Suomen arkistojen, kirjastojen ja museoiden aarteita. Finnassa on avoin rajapinta, jonka päälle on rakennettu mm. helsinkikuvia.fi-palvelu. Helsinkikuvia.fi:ssä on kymmeniä tuhansia valokuvia Helsingistä vuosikymmenten varrelta.

Kokoelmatietojen ja valokuvien lisäksi Helsingin kaupunginmuseo on julkaissut avoimena datana rakennusten ja kulttuurihistoriallisesti merkittävien porrashuoneiden historiatietoja sekä Signe Branderin panoraamakuvia. Myren kertoo, että aineistojen avaamisen myötä esimerkiksi museon valokuvia on käytetty enemmän niin perinteisessä mediassa kuin taideprojekteissa, kaupallisissa tulostuspalveluissa sekä sovelluksissa.

Digitoidut arkistoaineistot hyötykäyttöön

Helsinki ennen -sovelluksessa voi tarkastella vanhaa Helsinkiä ja tutkiskella kiehtovia vanhoja kuvia ja karttoja. Palvelussa vierailee kuukausittain muutamia tuhansia ihmisiä.

Suomen ja Pohjoismaiden historian dosentti Samu Nyström Helsingin yliopistosta on tyytyväinen, kun digitoituja historiallisia aineistoja on koko ajan paremmin tarjolla. Hänen mukaansa merkittävä ero aikaan ennen digitaalisia aineistoja on tiedon löydettävyys: tietoa on haettavissa monella muullakin tapaa ja laajemmin hakumahdollisuuksin kuin paikan päälle arkistoon menemällä. Tieto on myös paremmin hyödynnettävissä, kun digitaalisia aineistoja pystytään keräämään enemmän ja käsittelemään koneellisesti. Esimerkiksi big data mahdollistaa aiempaa suuremmat tutkimusteemat ja uudenlaiset tutkimuskysymykset. Tutkimustulosten tarkastaminen ja tieteen verifiointi ovat myös helpottuneet, kun keskeisimmät aineistot ovat helposti verkon kautta kaikkien saatavilla.

Projektikoordinaattori Kati Katajisto Helsingin yliopistosta on Nyströmin kanssa samoilla linjoilla. Hän kertoo, että yliopistolla on käynnissä useita digiloikka-hankkeita, joissa pohditaan mm. opetuksen sisältöjä ja opiskelijoilta edellytettäviä taitoja. Esimerkiksi yhdellä pilottikurssilla tehdään sisällissotaan liittyviä #Helsinki1918-twiittejä.

Katajisto kertoi myös Helsingin kaupungin historiatoimikunnasta, joka mm. suunnittelee ja tuottaa uutta tutkimusta Helsingin historiasta. Toimikunta etsii myös uusia tapoja tuotteistaa Helsingin historiaa eri kohderyhmille, kuten kaupunkilaisille, koululaisille, turisteille ja yrityksille. Tukholman kaupungin ylläpitämä Stockhomskällan-sivusto on yksi mielenkiintoinen esimerkki siitä, millaista koontia Helsingin historiasta toivottaisiin.

Sekä Nyström että Katajisto toteavat kuitenkin, että aineistojen digitointi saattaa myös rajata ja kaventaa tutkimuksen tekemistä, kun lähteinä saatetaan käyttää vain helposti saatavilla olevia aineistoja sen sijaan, että sukellettaisiin syvemmälle arkistojen uumeniin. Sillä, mitä digitoidaan, on siis vaikutusta myös siihen, mitä käytetään ja tutkitaan. He peräänkuuluttavat yhteistyötä ja dialogia aineistojen digitoijien sekä loppukäyttäjien välillä.

Historia-aineistojen parempi saatavuus kiinnostaa myös koodareita. Juuso Lehtinen esitteli tekemiään Helsinki ennen sekä Helsinki ennen ja nyt -karttasovelluksiaan, joissa kyseisen vuosikymmenen kartalla näytetään vanhoja kuvia Helsingistä. Näppärä koodari kertoi tehneensä Helsinki ennen -sovelluksen vajaassa viikossa, kun kaupunginmuseo avasi Branderin kuvat. Tuomas Myren kertoi kaupunginmuseon haaveilleen Helsinki ennen -sovelluksen tyyppisestä sivustosta, mutta museolla ei ollut resursseja toteuttaa sitä.

Suomessa on aktiivinen Open Knowledge Finlandin alla toimiva Avoin GLAM -verkosto, joka yhdistää kirjastojen, museoiden, arkistojen ja gallerioiden työntekijöitä ja auttaa kulttuuriorganisaatioita aineistojen digitoinnissa ja lisensoinnissa sekä datan avaamisessa, kertoi Tove Örsted. Verkosto järjestää myös Hack Your Heritage -tapahtumia. Seuraava kulttuurialan hackathon järjestetään syksyllä kaupunginmuseon tiloissa.

Tarvetta historialliselle paikkatiedolle

Tapahtuman lopuksi osallistujat saivat esittää datatoiveita ja ideoida, mitä avatuilla historiadatoilla voisi tehdä. Datatoiveissa paikkatieto nousi – jälleen kerran – ykköseksi. Tarvetta olisi mm. historiallisille aluejaoille, kortteleille, tonteille, rakennuksille ja rantaviivalle. Vanhojen karttojen georeferoinnin lisäksi keskusteltiin niihin kirjoitetun tiedon poimimisesta, kuten vektorimuotoisesta historiatiedosta sekä vanhoista kadun- ja paikannimistä. Näin historiallista tilastotietoa saataisiin helposti esitettyä kyseisen ajan karttapohjalla. Tämä tehostaisi tilastotiedon hyödyntämistä ja tutkimusten visualisointia kartalla.

Monet sovellusideoista pohjautuvat eniten toivottuun paikkatietoon. Osallistujat ideoivat erilaisia karttasovelluksia mm. tilastojen esittämiseen, vanhojen valokuvien tai muistojen keräämisen pohjaksi tai rakennusten historiatietojen näyttämiseksi. Lisätyn todellisuuden sovelluksilla voisi tarkastella ympäristöään menneinä vuosikymmeninä tai tutkailla toteuttamatta jäänyttä todellisuutta. Valtaosa sovelluksista on vahvasti visuaalisia, joten mielenkiintoisena ajatuksena nousi esiin myös menneen äänimaailman liittäminen sovelluksiin. Dataa siihen olisi saatavissa ainakin Ylen arkistoista.

Avaamalla suurempia kokonaisuuksia myös menneisyydestä saadaan rakennettua mielenkiintoisia uusia näkymiä historiaan ja muutokseen. Mitkä historialliset aineistot sinua kiinnostavat? Millaista tarinaa ne kertoisivat, mihin niitä voisi käyttää? Millainen olisi sinun aikakoneesi menneisyyteen?