Kännyköiden sijaintidata auttaa suunnittelemaan parempaa kaupunkia

Kaupunkitutkija Claudia Bergrothin palkittu gradu paljasti, miten pääkaupunkiseudun väestö liikkuu vuorokauden mittaan. Työ ei olisi syntynyt ilman avoimia datalähteitä ja Python-ohjelmointikieltä.

Valokuva.
Claudia Bergrothilla on hyviä uutisia sovelluskehittäjille. Helsingin tilastotiedon hyödyntäminen on tulevaisuudessa entistä helpompaa avoimien rajapintojen ansiosta.

Kännykkä on meillä jokaisella matkassa, mutta kännyköiden anonyymin sijaintitiedon hyödyntäminen kaupunkien suunnittelussa ottaa vasta ensi askeleitaan. Helsingin kaupunkitietoyksikön tutkija Claudia Bergrothin pro gradu -työ oli ensimmäinen yliopistossa tehty tutkimus, joka hyödynsi matkapuhelinaineistoja väestön sijainnin analysoinnissa Suomessa. Helsingin yliopiston Digital Geography Lab -tutkimusryhmässä vuonna 2019 tehty opinnäyte kahmikin peräti kolme gradupalkintoa, muun muassa Helsingin kaupungilta ja Suomen maantieteelliseltä seuralta.

”En todellakaan osannut odottaa, että se herättäisi niin paljon kiinnostusta”, Claudia Bergroth kertoo.

Bergrothin ohjaaja, professori Tuuli Toivonen oli tutkimusryhmineen onnistunut hankkimaan kotimaisen matkapuhelinoperaattorin anonymisoitua verkkodataa tutkimuskäyttöön. Se sisälsi tunnin tarkkuudella puheluiden, tiedonsiirtoyhteyksien ja verkkoyhteyksien muodostusyritysten lukumäärän kännykkäverkon kussakin tukiasemassa.

Bergroth ryhtyi penkomaan dataa ja selvitti, miten se kuvaa ihmisten sijaintia. Bergroth jalosti datan 24 tunnin väestöaineistoksi ja osoitti, että matkapuhelinten verkkodata kertoo erittäin tarkasti, missä ihmiset pääkaupunkiseudulla eri vuorokaudenaikoina sijaitsevat.
”Tiedämme kuinka suuri osuus väestöstä on kussakin tilastoruudussa eri tunteina, ja miten määrä vaihtelee vuorokauden mittaan”, Bergroth kertoo.

Työssä syntyi myös dynaaminen saavutettavuusmalli, jolla voi tutkia esimerkiksi yksittäisten kauppojen potentiaalista asiakaspohjaa eri vuorokaudenaikoina.

Matkapuhelindatan lisäksi Bergroth käytti 24 tunnin väestöaineiston pohjana lukuisia muita datalähteitä, joista useimmat olivat onneksi avoimesti saatavilla. ”Käytin Maanmittauslaitoksen avoimia paikkatietoaineistoja, Suomen ympäristökeskuksen dataa, kuntien tuottamia rakennustietoja, Tilastokeskuksen tuottamaa ajankäyttötutkimusta ja OpenStreetMap-yhteisön luomia kartta-aineistoja. Ilman avoimia datavarantoja ei gradua olisi syntynyt”, Bergroth kertoo.

Kuka?

Claudia Bergroth

Koulutus FM, geoinformatiikka
Työpaikka Helsingin kaupunginkanslian kaupunkitietoyksikkö, tutkija

Avoimen datan suosikkityökalut
1. Python-ohjelmointikieli
2. Avoimen lähdekoodin QGIS-paikkatieto-ohjelmisto
3. Notepad++

Mitä tehnyt datalla

Claudia Bergrothin gradu kiteytettynä kahden sekunnin animaatioksi
näyttää, miten väestön sijainnin painopiste siirtyy pääkaupunkiseudulla tunneittain. Animaatiossa näytetään koko päivä, yhden tunnin askeleissa esittäen ihmismäärää 250 neliömetrin alueilla, tummemmalla tai vaaleammalla värillä. Suurin osa ihmisistä lähtee aamulla kohti keskustaa, ja iltaa kohti palaavat takaisin alueellensa.

Mikä data kiinnostaisi

”Toivoisin, että matkapuhelindata olisi helpommin tutkijoiden saatavilla.”

Mac, Windows vai Linux

”Töissä on Windows-koneet, joten sitä käytetään.”

Terveiset HRI:lle

”Teette erinomaista työtä, jatkakaa samaan malliin. ”

Tilastotieto kaupungista lähtökohtaisesti avointa

Dataa Bergroth penkoo myös nykyisessä työssään Helsingin kaupunkitietoyksikön tutkijana: ”Työskentelen paljon kaupunkitilastojen ja muun kaupunkitiedon parissa. Tämä on ihan mielettömän monipuolinen työnkuva: datan analysointia, prosessointia ja visualisointia, ja viime aikoina paljon erilaisia automatisointihankkeita.”

Kaupunkitiedon tuottajien periaate onkin ollut jo vuosia, että tutkimuksissa ja tilastotuotannossa käytetyt tietoaineistot pyritään tarjoamaan kaikkien käyttöön avoimena datana. Kaikissa tapauksissa tämä ei ole mahdollista, mutta merkittävä osa datoista on jo avattu HRI-palvelussa. Keskeiset Helsinkiä koskevat alueelliset tilastot löytyvät myös Aluesarjat-tilastotietokannasta.

”Tulevaisuudessa Helsingin tilastotiedon hyödyntäminen on sovelluskehittäjille entistä helpompaa”, lupaa Bergroth. Vielä nyt kaupungin ylläpitämät tilastotietokannat ovat hajallaan useassa eri paikassa, mutta pian ne saadaan yhteiselle alustalle, jossa on myös helppokäyttöiset koneluettavat rajapinnat. Se on iso juttu paitsi sovelluskehittäjille, myös kaupungille itselleen: ”Tuotamme paljon raportteja kaupungin päätöksenteon tueksi. Uuden alustan avulla voimme automatisoida raportointia.”

Python taipuu moneen

Niin gradun teossa kuin Bergrothin nykytyössä on yksi työkalu yli muiden: ”Pythonilla pystyy tekemään mitä vain. Hieno juttu on sekin, että se on avointa lähdekoodia.” Python-kieli ja sen monet kirjastot ovat valttia isojen data-aineistojen käsittelyssä. Python-lukutaito kannattaa hankkia, jos datan käsittely vähänkään kiinnostaa. ”Se on tosi kiitollinen ohjelmointikieli opiskeltavaksi. Itseopiskeluun löytyy laajasti materiaalia, ja käyttäjäyhteisöltä saa tukea, jos jää jumiin jonkin ongelman kanssa”, kertoo Bergroth.

Toinen rakas työkaluohjelmisto maantiedettä opiskelleelle on QGIS. ”Sillä tulee tehtyä paljon karttoja. Se on näppärä ja hieno avoimen lähdekoodin tuote”, Bergroth kertoo.

Entä mikä on Bergrothin oma päällimmäinen datatoive? Toiveena olisi, että matkapuhelinverkkodata olisi nykyistä helpommin tutkijoiden saatavilla. Oma gradu raapaisi vain pintaa, sillä hyödyntämismahdollisuuksia on paljon. Matkapuhelinverkon automaattisesti tallentama paikkatieto antaa tutkijoille mahdollisuuden tarkastella ihmisten liikkumista aivan uusilla tavoilla. Sitä voi hyödyntää liikennesuunnittelussa, tutkia miten hyvin kaupungin palvelut tavoittavat asukkaat tai saada reaaliaikaista tietoa koronarajoitusten vaikutuksista ihmisten liikkumiseen. ”Saisimme verkkodatasta paljon hyvää dataa päätöksenteon ja tutkimuksen tarpeisiin”, Bergroth pohtii.

Graduaineisto julkaistaan avoimena datana

Bergroth onkin ollut valmistelemassa tieteellistä julkaisua, jossa hänen oma graduaineistonsa julkaistaan avoimena datana kaikkien käyttöön. Aineisto julkaistaan heti, kun se on läpäissyt tieteellisen arviointiprosessin. Bergroth on jalostanut dataa harrastelijoillekin sopivaan muotoon: ”Se on yhteensopiva 250 metrin tilastoruudukon kanssa. Dynaamista väestöaineistoa voi helposti yhdistellä muiden tilastoaineistojen kanssa.”

Bergrothin toive on, että datajulkaisu lisää intoa hyödyntää matkapuhelinverkon sijaintidataa myös Digital Geography Lab -tutkimusryhmän ulkopuolella. Tutkimusaineistojen avaaminen takaa myös sen, että tutkimus on aidosti läpinäkyvää. ”Toivottavasti joku keksii jotain, mitä me emme ole keksineet ajatellakaan”, Bergroth pohtii.

Claudia Bergrothin uravalinta ratkesi taannoin lukion maantiedon tunnilla, kun hän näki videon, jolla yliopistotutkija Tuuli Toivonen, myöhemmin Bergrothin geoinformatiikan professori, kertoi lukiolaisille mitä paikkatieto oikein on. ”Se oli ihan mahtavan inspiroivaa, ja avasi hyvin paikkatiedon maailmaa.”

Avoimesta datasta Bergroth innostui lisää työskennellessään maantieteen opiskelijana Maanmittauslaitoksella. HRI-palvelu on innostanut muita kaupunkeja avaamaan omia datavarantojaan. Maanmittauslaitos taas on ollut tärkeä esikuva koko valtionhallinnolle tiedon avoimuudessa.
”Maanmittauslaitos oli hieno näköalapaikka avoimeen dataan.”

Uncovering population dynamics using mobile phone data: the case of Helsinki Metropolitan Area. Pro gradu, Claudia Bergroth, Helsingin yliopisto 2019.

Digital Geography Lab on nyt julkaissut Claudia Bergrothin graduaineiston avoimena datana. Lisätietoa datasta tiedotteesta ja datan lataus täältä. (Lisätty tekstiin 16.2.2022)

Valokuva Aleksanterinkadun ihmisvilinästä.
Kännykkäverkkojen tuottamaa ihmisten sijaintitietoa voisi hyödyntää kaupunkien suunnittelun ja päätöksenteon tukena. Kuva: Paavo Jantunen / Helsingin kaupungin aineistopankki.