7. Tiedon hyödyntämisen seuranta

Käytön seuranta

Tässä vaiheessa kuvataan, miksi ja miten organisaation voi seurata avatun tietoaineiston käyttöastetta.

Avatun tietoaineiston käyttöasteen seurantaan ei ole olemassa virallisia suosituksia.

Usein investointipäätöksiä avoimen datan julkaisuihin pitää perustella taloudellisilla hyödyillä ja siksi avoimen datan hyötyjen mittaaminen on tärkeää. Organisaatio on voinut asettaa tähän liittyen myös määrällisiä tavoitteita.

Tietoa jo avanneita organisaatioita usein kiinnostaa, kuinka paljon heidän julkaisemaansa tietoaineistoa on katseltu tai ladattu dataportaalissa.  On tärkeää huomioida, että dataportaalissa tai muussa verkkopalvelussa julkaistun tietoaineiston katselu- ja lataustiedot eivät kerro siitä, onko tietoaineistoa varsinaisesti hyödynnetty ja miten, mutta antavat osviittaa siitä, miten avattu tietoaineisto herättää kiinnostusta.

Avoimen datan mittaaminen on hankalaa, mutta käytön suuruusluokkia on mahdollista mitata ja arvioida. Mahdollisia mittauskeinoja ovat esimerkiksi tiedoston katselun ja latauksien sekä rajapinnan käyttöstatistiikka. Lisäksi voidaan mitata esimerkiksi medianäkyvyyttä, dataa hyödyntävien organisaatioiden määrää ja hyödyntävien sovellusten määrää. Tietoa avoimen datan käytöstä voidaan kerätä esim. mediaseurannan avulla (avainsanat), kyselytutkimusten avulla ja tarjoamalla erilaisia kannustimia kertoa datan käytöstä.

Mittaamisen osa-alue Esimerkki mittarista
Lataukset Tiedostojen latausmäärä
Katselu Tiedostojen selailumäärä
Rajapinnan käyttö Rajapinnan käyttötilastot
Hyödyntämisen seuranta Mediaseuranta ja lehtiartikkelit
Hyödyntämisen seuranta Hyödyntävien organisaatioiden määrä
Hyödyntämisen seuranta Hyödyntävien sovellusten määrä
Hyödyntämisen seuranta Datan käyttö hackathoneissa
Hyödyntämisen seuranta Korkeakoulujen yhteydenotot
Palaute Yhteydenotot, lukumäärä, sisältö, taustaorganisaatiot

Julkaistun datan käytön seurantaan vaikuttaa myös se, missä muodossa data on julkaistu. Dynaamisessa muodossa, eli usein rajapintana, julkaistun datan käytöstä on mahdollista saada erilaisia tilastoja ja sen käyttöä on kohtuullisen helppo seurata. Sen sijaan staattisen datan, eli tiedostojen, käytön seuraaminen on haasteellisempaa.

Staattinen data ladataan yleensä vain kerran, jonka jälkeen käyttäjä voi käyttää sitä rajattomasti. Staattisen datan latauskerrat eivät välttämättä kerro mitään datan käytön laajuudesta tai datan julkaisemisen vaikuttavuudesta. Lisäksi avoimen datan lisenssit sallivat datan uudelleenjakamisen, joten myös muut tahot voivat jakaa tiedostoa omissa palveluissan. Esimerkiksi yksittäinen tiedotusväline saattaa ladata kerran aineiston, jonka pohjalta tehdään useisiin tiedotusvälineisiin leviävä uutinen. Näin yhdelläkin latauskerralla voi olla suuri vaikuttavuus.

Rajapintojen käytöstä on mahdollista kerätä analytiikkaa, jota voit hyödyntää rajapinnan kehittämisessä ja mahdollisesti myös datan laadun parantamisessa. Tilastojen koostamisessa voi käyttää apuna erilaisia ohjelmia kuten Google Analyticsia. Analytiikkaa voi kerätä esimerkiksi datan yleisestä käyttövolyymista ja tavoista, rajapintakutsuista sekä käyttäjien sijainnista. Mikäli rajapinnan käyttö on sidottu API-avaimeen, voi sen avulla erotella datan hyödyntäjät. API-avaimia voi jakaa myös anonyymisti, jolloin tiedon käyttäjät säilyttävät anonymiteetin eikä API-avaimen käyttö heikennä avoimuuden perusperiaatteita.

Avoindata.fi-palvelun seurantatavat

Avoindata.fi-palvelussa julkaistujen tietoaineistojen katselu- ja latauskerrat näkee kunkin tietoaineiston sivulta avoimesti. Lisäksi palvelun Tilastot-sivulta löytyy tietoja esimerkiksi suosituimmista tietoaineistoista. Palvelusta löytyy myös sovellusgalleria, joka kerää kokonaiskuvaa avointa dataa hyödyntävistä sovelluksista, painottaen valtion avoimia aineistoja. Lisäksi avoindata.fi palvelun käytössä on mediaseuranta (hakusanoina mm. avoin data, hackathon)

Ilmatieteen laitoksen seurantatavat

Ilmatieteen laitos käyttää Spatineo Monitoria käytön seurannassa (latausmäärät, käyttäjäryhmät). Lisäksi käynnissä on Spatineon kanssa jatkuvan tilannekuvan ja dashboardin kehittäminen. Avoimen datan käytöstä on raportoitu laitoksen Tietotilinpäätöksessä. 

Hyötyjen seuranta

Tässä vaiheessa kuvataan, miten organisaatio voi seurata avattujen tietoaineistojen käytöstä syntyviä hyötyä.

Avatun tiedon hyötyjen seurantaan ei ole olemassa virallisia suosituksia.

Datan avaamisen hyötyjä ja vaikutuksia on mahdotonta arvioida tarkasti, sillä avaamisella on paljon epäsuoria, vaikeasti mitattavia hyötyjä. Datan vaikuttavuudelle ei ole olemassa vakiintunutta arviointimittaristoa, koska tutkimus- ja mittausmenetelmien kehittäminen on vasta aluillaan.

Tietoa jo avanneissa organisaatioissa on pyritty seuraamaan ja mittaamaan datan avaamisen vaikutuksia ja vaikuttavuutta datan avaamisen jälkeen. Näin toimien organisaatio voi parantaa toimintansa tehokkuutta ja läpinäkyvyyttä. Ulkopuolisen palautteen laatu ja määrä voivat vaihdella, mutta joukossa voi olla erittäin hyviä oivalluksia mukana. Lisäksi seurantatiedoista on hyötyä, kun Suomi raportoi esimerkiksi EU:n vertailututkimukseen vuosittain avoimen datan luomia hyötyjä.

Avatun datan vaikuttavuudesta voi saada tietoa esimerkiksi seuraavilla menetelmillä:

  • Keräämällä tilastoja datan latauskerroista ja mahdollisuuksien mukaan käyttötapauksista. 
  • Seuraamalla datan käyttöä uusissa palveluissa, innovaatioissa ja sovelluksissa. 
  • Keräämällä tietoa datan vaikutuksista suoraan sen hyödyntäjiltä erilaisten kyselytutkimusten avulla.
  • Tekemällä kustannus-hyötyanalyysia datan avaamisen taloudellisista hyödyistä. Useiden hyötyjen rahallinen arvo on kuitenkin vaikeasti mitattavissa.
  • Teettämällä selvityksiä tai tutkimuksia aiheesta.

Vaikutuksia arvioitaessa kannattaa huomioida datan koko elinkaari sekä avaamisen vaikutukset laajemmasta yhteiskunnallisesta näkökulmasta. Vaikutusten arvioimisen avulla organisaatio voi kehittää tehokkuuttaan, toteuttaa paremmin julkista tehtäväänsä ja kasvattaa toimintansa läpinäkyvyyttä. 
 

Vaikuttavuustutkimus

Avoimen datan vaikuttavuutta voidaan arvioida esimerkiksi poliittisesta, yhteiskunnallisesta, taloudellisesta ja ympäristön näkökulmasta.

Euroopan komission hallinnoima Euroopan dataportaali toteuttaa vuosittain Open Data Maturity in Europe -tutkimuksen (englanniksi), jossa eurooppalaisia maita vertaillaan avoimen datan vaikuttavuuden perusteella. Avoimen datan vaikuttavuutta yhteiskuntaan arvioidaan neljän näkökulman avulla:

  1. Poliittinen vaikuttavuus (political impact): Miten esimerkiksi avoin data on lisännyt julkisen hallinnon tehokkuutta? Miten hallinnon läpinäkyvyys ja vastuullisuus on lisääntynyt?  Onko avointa dataa käytetty päätöksenteon tukena? Miten? Järjestetäänkö tapahtumia tietoperusteisen päätöksenteon tueksi? Miten vaikuttavuutta on seurattu?
  2. Yhteiskunnallinen vaikuttavuus (social impact): Onko avoin data lisännyt demokratiaa ja tasa-arvoa? Onko se lisännyt esimerkiksi vähemmistöjen osallistumista päätöksentekoon ja heidän pääsyään hallinnon palveluihin? Tuetaanko kansalaisyhteiskunnan toimintaa?
  3. Ympäristön vaikuttavuus (environmental impact): Vaikuttaako avoin data ympäristön tilaan? Entä kestävään kehitykseen ja kiertotalouteen? Miten sitä on hyödynnetty osana resurssitehokkuutta ja ympäristön suojelua? 
  4. Taloudellinen vaikuttavuus (economic impact): Millaista taloudellista arvoa avoin data luo? Onko avoimen datan luomaa arvoa selvitetty kansallisella tasolla? Onko taloudellisia hyötyjä hallinnolle selvitetty (kuluneen vuoden aikana)? Onko avoimen datan vaikuttavuudesta muuta tutkimusta?

Lisätietoja vaikuttavuustutkimuksesta Euroopan dataportaalissa.

Esimerkki: Avoin ympäristötieto

SYKE tarjoaa avointa tietoa kestävän ympäristön ja yhteiskunnan rakentamiseen. SYKEn avoin tieto -palvelussa on saatavilla aineistoja mm. pinta- ja pohjavesistä, Itämerestä, ympäristön kuormituksesta ja häiriötekijöistä, arvokkaista luonnonympäristöistä, maanpeitteestä ja rakennetusta ympäristöstä. Tietoja ovat tuottaneet ja keränneet pääasiassa valtion ympäristöhallinnon virastot, erityisesti SYKE ja Elinkeino-, liikenne- ja ympäristökeskukset.

SYKEn tavoitteena on olla edelläkävijä ympäristötiedon arvoketjun kehittämisessä. Avoin data palvelee tätä strategista päämäärää. Vaikuttavuuden arvioinnin tueksi avoimen datan käyttöä seurataan kokoamalla vuosittain tiedot avoimien rajapintojen käyttömääristä ja aineistolatausten määristä.

Lisäksi SYKEssä on tehty kyselyitä ja yksittäisiä haastatteluita avoimen tiedon käyttäjille. Kyselyiden perusteella voidaan saada yleispiirteinen kuva esimerkiksi avoimen ympäristötiedon käyttäjätahoista, käyttäjien kiinnostuksen kohteena olevista ympäristöteemoista ja yleistietoa aineistojen käyttökohteista. Avoimen ympäristötiedon käyttökohteiksi on kyselyissä mainittu mm. erilaiset päätöksentekoon ja suunnitteluun liittyvät tehtävät, tutkimus ja koulutus, ympäristön laadun selvittäminen, oman lähiympäristön asioihin vaikuttaminen sekä erilaisten tuotteiden ja palveluiden ylläpito tai kehittäminen.

Esimerkki: Ilmatieteen laitos

Ilmatieteen laitos on tehnyt avoimen datan vaikuttavuustutkimuksen 2019.  Analyysi on koettu hyödylliseksi ja suunnitelmissa on jatkossa tehdä vastaavaa säännöllisin väliajoin. Tutkimuksen tulokset on julkaistu Ilmatieteen laitoksen Tietotilinpäätöksessä 2020.

Avoimen datan hyödyntämistä käsitteleviä tutkimuksia ja selvityksiä

Turunen, S. & Ruokonen, T. 2018. Avoimen datan hyödyntäminen kuntasektorilla. Lataa avoimen_datan_hyodyntaminen_kuntasektorilla.pdf-tiedosto.

Herrala, Antti. 2018. Benefits from Open Data: Barriers of Supply and Demand of Open Data in Private Organizations (englanniksi) .

Muurinen, R. & Open Knowledge Finland. 2017. Liiketoimintaa avoimesta datasta. 100 tapauksen ajankohtaiskatsaus (pdf).

Koski, H. & Honkanen, M. & Luukkonen, J. & Pajarinen, M. & Ropponen, T. 2017. Avoimen datan hyödyntäminen ja vaikuttavuus. Valtioneuvoston selvitys- ja tutkimustoiminnan julkaisu 40/2017

Koski, H. 2015. Avoimen tiedon vaikuttavuus – esitutkimus. Valtiovarainministeriön julkaisuja.  

Kukkamäki, J., Mikkonen, A., Stormi, I. & Mäntyneva, M. (2020). Avoimen datan hyödyntäminen opetuksessa ja tutkimuksessa. Teoksessa J. Kukkamäki & M. Tarkkala (toim.), Avoin Häme. HAMK Unlimited Journal 25.8.2020.

Poikola, A. & Kola, P. & Hintikka, K. A. 2010. Julkinen data - johdatus tietovarantojen avaamiseen.  Liikenne- ja viestintäministeriö. 

Verhulst, S. G. & Young, A. 2018. Open Data Demand. Toward an open data demand assessment and segmentation methodology

Ahonen-Rainio, P. & Mäkelä J. & Virrantaus K. 2014. Menetelmä avoimen maastotiedon vaikuttavuuden arvioimiseksi (pdf)