Nopeusnäyttödata: Projektityö Haaga-Helian Business Intelligence -kurssilla
Syksyllä 2019 Haaga-Helian tietojenkäsittelyn koulutusohjelmassa tehtiin projektityö yhteistyössä Helsingin kaupungin kanssa. Opiskelijaryhmät analysoivat Helsingin kaupungilta saatua nopeusnäyttödataa ja yhdistivät siihen vähintään yhden muun avoimen datan lähteen. Esimerkkejä muista datalähteistä ovat Ilmatieteenlaitoksen säädata, liikenneonnettomuusdata, pyöräilijämäärädata, kaupunkipyörädata, HSL:n nousijamäärädata ja Trafin liikennemäärädata. Myös Maanmittauslaitoksen Kansalaisen Karttapaikka –palvelusta saatavaa dataa hyödynnettiin. Tässä esimerkkejä projektitöiden aiheista:
- Sääolosuhteet ja nopeudet. Onko näiden asioiden välillä havaittavissa yhteyksiä? Säädatasta tarkasteltiin lämpötilaa, sateen määrää sekä näkyvyyttä.
- Pyöräilijämäärät ja ajonopeus. Onko pyöräilijämäärien ja ajoneuvojen nopeuksien välillä yhteyttä?
- Liikenneonnettomuudet ja ajonopeudet. Onko onnettomuuksien ja ajonopeuksien välillä yhteyttä? Erityinen mielenkiinto kohdistui koulujen läheisyyteen sekä niihin kellonaikoihin ja päiviin, jolloin koululaisia on liikkeellä.
- Kalenteridata ja ajonopeudet. Juhlapyhien, viikonpäivien, kellonaikojen ja vuodenajan mahdollinen vaikutus ajonopeuteen.
Seuraavaksi esitellään joitakin projektien tuloksia sekä kokemuksia avoimen datan hyödyntämisestä opiskelijaprojektissa.
Projektien tuloksia
1) Pyöräilijämäärät ja ajonopeus
2) Kalenteridata ja ajonopeudet
Kokemuksia avoimen datan hyödyntämisestä opiskelijaprojektissa
Kokemukset avoimen datan hyödyntämisestä opiskelijaprojektissa olivat pääosin hyvät. Aito ja täysin uusi datasetti kiinnosti opiskelijoita.
Kokeillussa datassa oli yhdessä sovitut mittauspisteet ja aikavälit. Jatkossa olisi hyvä sopia samat aikavälit kaikille mittauspisteille. Dataa voisi jopa olla vähemmän, kunhan se olisi samalta aikajaksolta. Muuten data oli yhteismitallista, mikä on ensiarvoisen tärkeää.
Mittauspisteiden ilmaisussa käytetyn koordinaatiston olisi hyvä olla kansainvälinen (esim. WGS-84) sillä opiskelijamme käyttävät kansainvälisiä ohjelmistoja (kuten Microsoft Power BI ja KNIME). Jos kansainväliset koordinaatit olisivat käytetyn kansallisen muodon rinnalla, helpottaisi se datan nopeaa hyödyntämistä. Haaga-Helian opiskelijoista suuri osa on liiketoimintaan (eikä niinkään paikkatietoon tai datan käsittelyyn ja muunnoksiin) orientoituneita / erikoistuvia.
Itse nopeusdatan lisäksi dataan olisi hyvä liittyä metatietoa. Tämä on tärkeää varsinkin jos datan hyödyntäjät ovat muita kuin liikennesuunnittelun ammattilaisia. Olisi hyödyllistä tietää esimerkiksi nopeuden mittauspisteessä vallitseva nopeusrajoitus tai tieto siitä, mistä ko. tieto on mahdollista helposti saada. Lisäksi jonkinlainen kuvaus mittausten keräämistavasta ja mahdollisista mittausvirheistä, puuttuvista arvoista yms. olisi hyödyllinen.
Datan muotona opiskelijoidemme kannalta sekä CSV- että JSON-muodot ovat hyviä. Tällä opintojaksolla ei ole tarvetta käyttää dataa ohjelmointirajapinnan kautta, mutta joillakin muilla Haaga-Helian kursseilla sellainenkin tarve on. Kansalaisen Karttapaikkaa käytettäessä tuli esille, että JSON-muotoisen datan lataaminen ja jatkohyödyntäminen oli hankalaa. Opiskelijamme toivoivat, että JSON-datasta voisi ladata ainoastaan tarvitsemansa osuuden. Tällä hetkellä palvelusta saa suuren JSON-muotoisen tiedoston, jonka esikäsittely hyödynnettävään muotoon on työlästä ja vaatii osaamista.
Johtopäätökset
Kaiken kaikkiaan Helsingin nopeusnäyttödatan hyödyntäminen Haaga-Helian opiskelijaprojekteissa oli erittäin hyvä kokemus. Helsingin kaupunki tarjosi Haaga-Helian käyttöön asiantuntemustaan. Tämän lisäksi opiskelijoille tarjottiin mahdollisuus osallistua Helsinki Loves Developers –tapahtumaan. Yhteistyö HRI:n kanssa tarjosi opiskelijoille työelämälähtöisen ja ajankohtaisen oppimisympäristön. Haaga-Helian näkökulmasta yhteistyötä kannattaa ehdottomasti katkaa.
Teksti: Lili Aunimo ja Raine Kauppinen / Haaga-Helia