Helsingin historialliset tilastot helpommin käyttöön

Kaupunkitiedon kokoamisella on Helsingissä pitkät perinteet, ja pisimmät tilastojen aikasarjat ulottuvat 1800-luvulle asti. Kiinnostavan tiedon kerääminen tutkimusta tai muuta analysointia varten on silti usein suuren työmäärän takana. Siksi historialliset aikasarjat julkaistaan nyt verkossa avoimena tietona.

Helsingin kaupungin tietokeskuksessa käynnistyi keväällä 2015 projekti, jonka tavoitteena oli muodostaa Helsinkiä koskevia pitkiä aikasarjoja ja tuoda ne käyttäjien saataville verkkoon. Tähän asti näihin tilastollisiin aikasarjoihin on voinut tutustua vanhoissa painetuissa julkaisuissa, mutta nyt osa niistä on saatettu paremmin ja avoimesti hyödynnettävään muotoon. Kun päätin oman osuuteni projektissa, lopputuotoksena oli 45 kappaletta Helsinkiä eri näkökulmista kuvaavaa tilastoa, pieniä kurkistuksia menneen ajan elämään.

[Päivitys 8/2022: kaikki 45 tilastoa ovat edelleen saatavilla avoimena datana, mutta ne on koottu HRI:hin yhdeksi kuvaukseksi vuoden 2022 alussa pääkaupunkiseudun tilastotietokannan uudistuksen yhteydessä, lisätietoa tästä. Tilastot löytyvät Aluesarjoista otsikon ”Historialliset tilastot” alta.]

Aikasarjoja löytyy niin väestön, asumisen, työelämän ja elinkeinon kuin koulutuksenkin saralta. Aivan kaikki taulukot eivät ole aikasarjoja, vaan mukaan mahtuu myös muutama poikkileikkausaineisto. Aineistot on nyt julkaistu Aluesarjat-tilastotietokannassa sekä HRI:ssa.

Valokuva vanhoista vuosikirjoista pöydällä.
Helsingin historiallisia vuosikirjoja.

Suurin osa kokoamistani historiallisista aikasarjoista on työstetty Helsingin tilastollisen vuosikirjan taulukoista. Vuodesta 1908 lähtien julkaistu vuosikirja on merkittävä kaupunkitiedon lähde, johon on sen varhaisimmista vuosista alkaen kerätty tietoa muun muassa Helsingin väestöstä, terveydenhoidosta, koulutuksesta, asumisesta, rakentamisesta ja teollisuudesta. Vanhimmat vuosikirjat sisälsivät tietoa myös esimerkiksi vaivaishoidosta, valaistustoimesta, hyödykkeiden hinnoista ja jopa kaupungin viemärikanavista.

Vuosikirjojen sisältämiä tilastoja nostettiin laajalti esille vuonna 2000 ilmestyneessä upeassa juhlajulkaisussa Helsinki tilastoina 1800-luvulta nykypäivään (vain painojulkaisuna, löytyy tietokeskuksen kirjastosta). Kirja osoittaa, millaisten historiakuvausten tekemisen pitkä tilastoperinne mahdollistaa.

Vanhin aikasarja 1800-luvun alusta

Käyttäjän näkökulmasta – olipa tämä sitten tutkija, opiskelija tai historiatiedosta yleisesti kiinnostunut – ongelmallista voi olla tiedon heikko tekninen saatavuus. Tyypillisesti tutkimustulokset esitellään artikkeleissa koostetaulukoissa. Taulukoita joutuu etsimään painetuista julkaisuista, ja jopa digitoitu tieto on käytännössä tarjolla vain pdf-muodossa. Kiinnostavan tiedon kerääminen tutkimusta tai muuta analysointia varten voi olla kohtuuttoman työmäärän takana.

Helsingin kaupunki on sitoutunut avaamaan julkisia tietovarantojaan avoimena datana. Nyt avattavat historialliset aikasarjat tuovat pienen lisänsä tähän pioneerityöhön.

Pisimmälle historiaan ulottuvat aikasarjat sisältävät tietoa Helsingissä syntyneistä ja kuolleista. Aineisto alkaa vuodesta 1811 ja tarkastelee muun muassa kuolleisuuden syitä ja imeväiskuolleisuutta. Väestötieteestä kiinnostuneille on lisäksi tarjolla ikäryhmittäisiä hedelmällisyyslukuja 1930-luvulta lähtien. Ja aikasarjasta Helsingin väkiluku kaupunginosittain vuosina 1875–1960 saisi varmasti hienon karttavisualisoinnin!

Itseäni kiinnostaa kansa- ja oppikouluja kuvaavien tilastojen informaatio. Aineistoista on muun muassa mahdollisuus tutkia kansakoulujen oppilaiden vanhempien sosiaalista taustaa sekä sitä, millainen merkitys sivistyspohjalla oli oppikouluun pääsemisessä ja mitä väylää valtion ja yksityisiin oppikouluihin päästiin.

Jo mainituissa poikkileikkausaineistoissa on kyse työväen asunto-oloja kartoittavasta tutkimuksesta, jonka myötä Helsingin tilastokonttorikin, nykyisin siis tietokeskus, on saanut alkunsa. Monia varmasti kiinnostaa vuokra-asuntojen hintakehitys, josta siitäkin löytyy tietoa eri tilastoista vuosilta 1900 ja 1910, 1932-1974 sekä 1975-1980.

Tiedosta ei saa aina yhteismitallista

Mitä pidemmälle historiassa mennään, sitä haastavampaa yhtenäisten aikasarjojen luominen on. Tilastoinnin kehittyessä tieto toki tarkentuu, mutta vertailtavuus hankaloituu. Aikasarjojen tekeminen on ollut paljon työläämpää kuin työn aloittaessani uskoinkaan. Tämä on johtunut muun muassa muuttujien määrällisistä ja määritelmällisistä muutoksista ja lähteiden runsaudesta.

Lähteiden merkitsemisessä olen noudattanut erityistä huolellisuutta, sillä historiallisten kehityslinjojen hahmottelemiseksi on erityisen tärkeää kyetä arvioimaan tiedon paikkansapitävyyttä. Suomella on pitkät tilastoperinteet, mikä moninaisuudessaan asetti työlle omat haasteensa. Väestötaulukoissa vilisivät termit ”todellinen väestö”, ”kaupungissa asuva väestö” ja ”todella läsnäollut väestö”. Lisäksi lähteinä vaihtelivat henkikirjat, kirkonkirjat, väestölaskennat, korjatut väestötiedot jne. Suomen väestökirjanpito olikin alkujaan jakaantunut kahteen osaan: henki- ja kirkonkirjoihin.

Tutustu tarkemmin

Helsingin historialliset tilastot HRI:ssa

Helsingin historiaa numeroina kolmelta vuosisadalta – opas Helsingin seudun aluesarjat -tilastotietokannan pitkien aikasarjojen käyttöön (pdf)

Koska molemmat lähteet antoivat väestön määrästä jokseenkin väärän kuvan, ryhdyttiin 1800-luvun lopulla Helsingissä ja Suomen muissa suurimmissa kaupungeissa toimittamaan väestölaskentoja ”oikean” väkiluvun todentamiseksi. Lainausmerkit sen tähden, että tilastotieto ei voi koskaan antaa käsittelemästään asiasta täysin kattavaa kuvaa, vaan aina joudutaan rajaamaan, poissulkemaan ja tiivistämään. Vuonna 1950 toteutettiin ensimmäinen koko maan kattava väestölaskenta, jonka avulla vuosikirjojenkin väestötaulukoita on takautuvasti korjattu aina 1900-luvun alkuun.

Edellä esitetyn perusteella on selvää, ettei kaikkea tietoa ole pystytty yhteismitallistamaan, eikä aikasarjojen antamia tietoja voi tulkita absoluuttisesti. Käsillä olevat aikasarjat sisältävät kuitenkin parasta mahdollista saatavilla olevaa tietoa, joten on perusteltua tarjota niitä kaikkien hyödynnettäväksi.

Tekstin kirjoittaja Marjukka Vartiainen toimi projektisuunnittelijana Helsingin kaupungin tietokeskuksessa vuonna 2015.