Chatbotien koulutusdata on vuoden 2022 paras data-avaus

HRI-palvelun ohjausryhmä on valinnut vuoden 2022 parhaaksi data-avaukseksi Helsingin kaupungin chatbotien koulutusdatat. Kunniamaininnat saavat HSY:n Tekoälyllä tunnistettu paljas maa pääkaupunkiseudulla sekä Tekoälyllä tunnistetut vettä läpäisemättömät pinnat pääkaupunkiseudulla ja Helsingin kaupunginarkiston aineistot.

Piirroskuva äidistä, isästä ja lapsesta. Äiti keskustelee tietokoneella neuvolabotin kanssa, isä katsoo vieressä.
Helsingin kaupungin chatbotien koulutusdatat valittiin vuoden 2022 parhaaksi data-avaukseksi. Kuva: Mari Huhtanen.

HRI:n ohjausryhmä valitsi helmikuun kokouksessaan vuoden 2022 parhaaksi data-avaukseksi Helsingin kaupungin chatbotien koulutusdatat. Chatbotit ovat tekoälyohjelmistoja, joilla pyritään automatisoimaan useimmin kysyttyihin kysymyksiin vastaamista ja laajentamaan asiakaspalveluiden palveluaikoja. Avoimena datana on julkaistu chatbotien kouluttamisaineisto, kysymysten aiheet (intents), keskusteluun liittyvät muuttuja- tai synonyymikirjastot (entities) ja vastaukset (answers). Chatbotien kanssa käytyjä keskusteluita ei julkaista.

Ohjausryhmä pitää chatbotien koulutusdatan avaamista merkittävänä, sillä se on kansainvälisestikin melko ainutlaatuinen avaus. Oli myös hienoa, että ajatus koulutusdatan avaamisesta ei tullut Helsingin chatbot-asiantuntijoilta, vaan sote-toimialalta, jonka neuvolabotti NeRon koulutusdata avattiin ensimmäisenä. Avauksen yhtenä tarkoituksena on lisätä bottien läpinäkyvyyttä, mikä on myös tekoälyn eettiseltä kannalta erittäin hyvä asia, sekä tarjota valmista koulutusmateriaalia muille vastaavanlaisia chatbotteja kehittäville tahoille.

Ohjausryhmä antoi lisäksi kunniamaininnat seuraaville data-avauksille:

HSY:n tekoälyn avulla laaditut aineistot pohjautuvat ortoilmakuvien ja pistepilvien tulkintaan konvoluutioneuroverkkoihin perustuvalla menetelmällä. Helsingin seudun maanpeiteaineistoa on tuotettu vuodesta 2014 alkaen. Vuonna 2021 aineiston tuotannossa kokeiltiin ensimmäistä kertaa tekoälyä, ja nyt kunniamaininnan saaneet, vuonna 2022 avatut datat ovat pilotteja, joissa testattiin tekoälymenetelmiä muutaman valitun maanpeiteluokan kohdalla. Pilottien pohjalta päätettiin tehdä vuoden 2022 Helsingin seudun maanpeiteaineisto ensimmäistä kertaa kokonaisuudessaan tekoälymenetelmiä hyödyntäen. Asfaltti- ja hiekkapintojen erottaminen toisistaan kuvantulkintamenetelmin on ollut haaste maanpeiteaineiston aikaisempien versioiden tuotannossa. Kuntien olisi kuitenkin tärkeää erottaa nämä pinnat toisistaan ilmastonmuutokseen sopeutumisen näkökulmasta, sillä satava vesi ei läpäise asfalttipintoja, mikä voi johtaa hulevesitulvien riskiin.

Helsingin kaupunginarkiston aineistot puolestaan on valtava aineistokokonaisuus, joka sisältää kymmeniä tuhansia sivuja arkiston digitoituja aineistoja, kuten piirrustuksia, karttoja ja kaupunginhallituksen mietintöjä. Aineistoja digitoidaan koko ajan lisää. Aineistot löytyvät kaupunginarkiston oman Sinetti-järjestelmän lisäksi myös kansallisesta Finna-palvelusta. Kansalliskirjaston ylläpitämässä Finna-palvelussa on avoin rajapinta, jonka kautta voi hakea kaupunginarkiston aineistoja.

Palkinnoksi voittajadatasta kirjoitetaan laaja artikkeli, jossa kerrotaan tarkemmin Helsingin chatbotien koulutusdatasta ja sen tarjoamista mahdollisuuksista. Artikkeli julkaistaan mm. hri.fi:ssa.

HRI:n ohjausryhmä on valinnut vuoden data-avauksen vuodesta 2016 lähtien. Aikaisempiin vuoden data-avauksiin ja kunniamainintojen saajiin voi tutustua HRI:n sivuilla.