Helsingin liikenneonnettomuuksien visualisointia
Blogisarjasta
Tiedosta kartta – Sivari avoimen datan pyörteissä on blogisarja, josssa HRI:n siviilipalvelusmies Juho Antikainen kirjoittaa kaikesta avoimeen dataan enemmän tai vähemmän liittyvästä syksyn 2022 ja kevään 2023 aikana.
Tällä kertaa visualisoin pistemäistä paikkatietoaineistoa ensiksi pelkkinä pisteinä kartalla ja sitten lämpökarttoina. Esimerkkiaineistona käytän Helsingin kaupunkiympäristön toimialan ylläpitämää liikenneonnettomuusrekisteriä, joka on saatavilla CSV-tiedostona HRI-palvelusta.
Aineistossa on ainoastaan poliisin tietoon tulleet liikenneonnettomuudet, joten moottoriajoneuvo-onnettomuudet ovat yliedustettuna ja jalankulkijaonnetomuudet aliedustettuna.
Aineistoa on saatavilla vuodesta 2000 vuoteen 2021 ja se päivittyy kerran vuodessa. Aineistossa jokaisesta onnettomuudesta on ominaisuustietona sen vakavuus, onnettomuuden heikoin osapuoli eli onnettomuustyyppi ja onnettomuusvuosi. Vakavuutta kuvataan kolmiportaisena asteikkona: omaisuusvahinkoihin, loukkaantumiseen ja kuolemaan johtaneet onnettomuudet. Onnettomuuksien kokonaismäärä aineistossa on 50 724 ja visualisoinnit laaditaan koko aineistosta ellei toisin mainita.
Visualisoinnit on tehty käyttämällä avoimen lähdekoodin QGIS paikkatieto-ohjelmiston versiota 3.16. Yksityiskohtaisemmat ohjeet visualisointien toteuttamisesta QGIS-ohjelmalla kokoan erilliseen pdf-tiedostoon. Jos paikkatieto tai QGIS-ohjelma eivät ole ennestään tuttuja, suosittelen tutustumaan Helsingin kaupungin avoimen paikkatiedon aloittelijan oppaaseen. Lisäksi QGISsin virallinen dokumentaatio (englanniksi) saattaa olla avuksi.
Pisteitä kartalla
Yksinkertaisin tapa visualisoida liikenneonnettomuuksia on kuvata onnettomuudet pisteinä ja asettaa ne kartalla. Aineistossa olevien koordinaattitietojen avulla CSV-tiedoston saa helposti siirrettyä QGISsin karttanäkymään. Siinä aineistoa on helpompi tutkia tarkemmin esimerkiksi paikkatieto-ohjelman infotoiminnolla. Tämän avulla huomataan esimerkiksi, että Santahaminan ainoa aineistossa oleva onnettomuus on loukkaantumiseen johtanut pyöräilyonnettomuus vuodelta 2006 (kuva alla).
Yksiväriset pisteet eivät ole kauhean mielenkiintoisia ja kartasta näkee ainoastaan sen, että Helsingissä on tapahtunut paljon onnettomuuksia. Onnettomuudet vaikuttavat keskittyvän tiheimmin asutuille alueille kuten kantakaupunkiin. Yksi tapa kehittää visualisaatiota on piirtää datapisteet eri väreillä aineiston ominaisuustietojen perusteella. Alla on esitetty kartta, jossa aineisto on luokiteltu onnettomuustyypin perusteella.
Tästä kartasta saa jo hieman enemmän irti. Ensinnäkin moottoriajoneuvojen väliset onnettomuudet ovat selvästi aineiston yleisin onnettomuustyyppi. Lisäksi aineistosta voi erottaa onnettomuuksien nauha, joka seuraa suurimpia valtaväyliä. Karttaa katsoessa on kuitenkin tärkeää muistaa, että aineistossa on ainoastaan poliisin tietoon tulleet onnettomuudet, jotka ovat puutteellisia erityisesti jalankulkijoiden tapauksessa.
Toinen tapa lähestyä aineistoa on luokitella pisteet onnettomuuden vakavuuden mukaan ja tuloksen näkee alta. Tästä huomataan, että ainoastaan omaisuusvahinkoihin johtaneet onnettomuudet ovat ylivoimaisesti yleisimpiä. Kuolemaan johtaneita onnettomuuksia vaikuttaa olevan vain yksittäisiä kappaleita.
Vaikka edellä esitellyt visualisoinnit esittivät aineiston maantieteellisen jakautumisen ja eri onnettomuustyyppien yleisyydet, niiden toistuvana ongelmana on pisteiden suuri määrä pienellä maantieteellisellä alueella. Tällöin pisteet piirtyvät kartalla toistensa päälle, mikä aiheuttaa muutamia ongelmia. Ensinnäkin karttaa ei ole miellyttävä katsoa, sillä kartalla on tuhansia datapisteitä, mikä saa kartan näyttämään hälyisältä. Toisekseen pisteiden piirtyessä päällekkäin monet datapisteet jäävät piiloon muiden pisteiden alle. Esimerkiksi ylläolevasta kartasta on vaikea erottaa kuolemaan johtaneita onnettomuuksia. Ongelman vaikutusta visualisointiin voi havainnollistaa muuttamalla ylläolevan kartan pisteiden piirtojärjestystä. Alla olevassa esimerkissä piirtojärjestys on muutettu vakavuusjärjestykseen: päällimmäisenä kuolemaan johtaneet onnettomuudet ja alimmaisena omaisuusvahinkoihin johtaneet onnettomuudet.
Aikaisemman kuvan perusteella kuolemaan johtaneita onnettomuuksia olisi ollut vain yksittäisiä, mutta piirtojärjestystä muuttamalla huomataan kuolemaan johtaneiden onnettomuuksien määrän olevan yllättävän suuri.
Lämpökartat visualisoinnin selkeyttäjänä
Toinen tapa visualisoida onnettomuuksia on käyttää lämpökarttoja (eng. heat map) Lämpökartoissa kuvataan yksittäisten datapisteiden sijasta pisteiden tiheyttä. Mitä enemmän datapisteitä alueella on, sitä ”lämpimämpänä” alue näkyy kartalla. Tällöin lämpökartat ovat oivallinen työkalu aineiston maantieteellisen jakauman visualisointiin. Taustakarttana käytän Väylän ylläpitämää Digiroad-aineistoa päällystetyistä teistä Helsingissä.
Seuraavaksi esittelen muutamia mielenkiintoisia lämpökarttoja. Alla on lämpökartta koko liikenneonnettomuusrekisteriaineistosta. Lämpökartasta näkee, että liikenneonnettomuudet ovat keskittyneet kantakaupungin ympäristöön ja pääväylille. Tämän lisäksi lämpökartassa on havaittavissa selvää pääväyliä mukailevaa nauhamaisuutta.
Onnettomuuksien keskittyminen suurille väylille ja niiden risteyksiin voisi johtua auto-onnettomuuksien suureen määrään suhteessa muuhun aineistoon. Katsotaanpa miten kartta muuttuu, jos lämpökartasta poistetaan auto-onnettomuudet.
Ero edelliseen karttaan on selvästi havaittavissa. Nauhamainen rakenne pääväylien ja niiden liittymien kohdalla on kadonnut lähes kokonaan. Sen sijaan onnettomuudet ovat jakautuneet tasaisemmin Helsingin alueelle muodostaen monia onnettomuusrykelmiä, jotka jäivät piiloon ensimmäisessä lämpökartassa.
Kun tarkasteluun otetaan ainoastaan moottoripyörien onnettomuudet, päärautatieaseman onnettomuuskeskittymä katoaa ja onnettomuudet ovat jakautuneet rykelmiin koko Helsingin alueelle.
Jalankulkijoiden onnettomuudet ovat taas keskittyneet voimakkaasti kantakaupunkiin rautatieaseman ympäristöön, kuten alta voidaan nähdä. Tämä ei tarkoitta sitä, että jalankulkijat voivat jäädä auton alle ainoastaan kantakaupungissa vaan jalankulkijoiden osuus koko aineistosta on pienempi kuin todellisuudessa (noin 6 % koko aineistosta).
Yleisvaikutelma visualisoinneista on se, että onnettomuuksien maantieteellinen jakautuminen vaihtelee huomattavasti eri onnettomuustyyppien välillä. Moottoriajoneuvo-onnettomuudet ovat keskittyneet kantakaupungin lisäksi erityisesti pääväylille kun taas polkupyörien ja moottoripyörien onnettomuudet ovat jakautuneet tasaisemmin ympäri Helsinkiä.
Verrattuna pistevisualisointiin lämpökartoista näkyy paremmin aineiston maantieteellinen jakautuminen ja visualisointia on miellyttävämpi katsella. Toisaalta lämpökartoissa yksittäisiä datapisteitä ei ole enää näkyvissä, jolloin oleellista tietoa saattaa jäädä piiloon. Esimerkiksi kuolonkolareita on niin vähän (vajaa 100), että ainoastaan niiden esittäminen lämpökarttana ei ole mielekästä. Lisäksi lämpökartoissa lukumääräisesti suurimmat onnettomuustyypit hallitsevat visualisointia. Tämä näkyy erityisesti koko aineiston sisältäneessä lämpökartassa, jossa moottoriajoneuvo-onnettomuudet hallitsevat visualisointia.
Onnettomuustyyppien ja onnettomuuksien vakavuuksien lisäksi aineistoa voisi visualisoida myös onnettomuusaikojen perusteella. Lisäksi aineistoon voisi yhdistää esimerkiksi Helsingin liikenneonnettomuuskyselyn tuloksia ja tutkita, miten kaupunkilaisten mielikuvat vaarallisista paikoista korreloi todellisuudessa tapahtuneiden onnettomuuksien kanssa. Nämä aiheet kuitenkin jäävät tämän blogin ulkopuolelle ja ehkä sinä voisit tutkia asiaa tarkemmin!