4. Suunnittelu ja toteutus
Tämän vaiheen voi toteuttaa esimerkiksi näin
Organisaation tiedon jakamista edistävä henkilö ja datan hallinnoija:
- Arvioivat datan jakamismahdollisuuksia mm. käyttöoikeuksien osalta.
- Arvioivat datan jakamisesta koituvia hyötyjä, riskejä ja kustannuksia.
- Arvioivat tarvetta datan anonymisoinnille ja aggregoinnille.
- Arvioivat jaettavan datan laatua.
- Valitsevat lisenssin, jolla dataa aiotaan jakaa.
- Päättävät datan avaamisesta.
Tietosuoja-asiantuntijaa:
- Konsultoidaan tietoturva- ja tietosuojariskien tunnistamisessa.
- Konsultoidaan anonymisoinnin ja aggregoinnin tarpeesta.
Organisaation IT-asiantuntijat sekä jaettavasta datasta vastaava henkilö:
- Arvioivat datan jakamisen teknistä toteutusta, esimerkiksi jaetaanko data tiedostona vai rajapintana.
Avattavan tiedon määrittely
Tässä vaiheessa kuvataan asioita, joita organisaation on hyvä arvioida ja määritellä, kun organisaatio ryhtyy suunnittelemaan tiedon avaamista käytännössä.
Avattavan tietoaineiston määrittelyyn ei ole olemassa virallisia suosituksia.
Tietoa jo avanneissa organisaatioissa on yleensä alkuun tunnistettu, kuka hallinnoi ja vastaa avattavaksi suunnitellusta tiedosta ja sen taustalla toimivasta tietojärjestelmästä sekä mahdollisia käyttötapauksia. Tässä vaiheessa voi hyödyntää esimerkiksi organisaation tiedonhallintamallia, johon on kuvattu organisaation tietovarannot, tai tukeutua tiedon avaamiseen vastuutetun henkilön apuun, mikäli organisaatiossa on tähän tehtävään osoitettu resursseja.
Tietoa avanneet organisaatiot ovat käyneet läpi tietoaineiston omistajuuteen, tekijänoikeuksiin, tiedon luovutuksiin, tietosuojaan ja tietoturvallisuuteen liittyvät seikat. Mikäli nämä seikat eivät ole estäneet tiedon jakamista, on tiedon hallinnoijan kanssa selvitetty, miten tietoaineisto olisi käytännössä muodostettavissa ja jaettavissa teknisesti. Samalla on määritelty avattavan tietoaineiston kattavuus ja tarkkuustaso, jolla tietoaineiston voi avata, jotta tiedon hyötypotentiaali tai hyödynnettävyys ei kärsi.
Tietoaineiston määrittelyn yhteydessä on arvioitu
- tiedon avaamisesta mahdollisesti koituvia hyötyjä, riskejä ja kustannuksia,
- avattavan tietoaineiston laatua, metatietoja ja julkaisupaikkaa,
- tietoaineiston elinkaarta ja
- suunniteltu riittävä tietoliikennekapasiteetti ja käyttäjätuki.
Näitä asioita kuvataan tarkemmin seuraavissa vaiheissa.
Tietoa avanneet organisaatiot ovat lähtökohtaisesti pyrkineet selvittämään, onko kyseisen tiedon avaamiseen (esimerkiksi tiedon mallinnukseen ja formaatteihin) olemassa kansallisia tai kansainvälisiä standardeja tai onko jo jokin toinen taho avannut vastaavanlaisen datan, jolloin sen tietomallia voi käyttää omassakin avauksessa.
Suomen kuusi suurinta kaupunkia ovat keränneet listaa eräistä kansainvälisistä standardeista (google sheets, englanniksi), joiden mukaisesti Suomessakin on tietoa jaettu. Aineistojen metatiedoissa esimerkiksi avoindata.fi:ssä käytetään DCAT-AP-tietomalliprofiilia. Kansainvälisiä standardeja käytettäessä kannattaa huomioida eri maiden lainsäädännön eroavaisuudet erityisesti tietosuojan osalta.
Samalla on hyvä myös pohtia, olisiko tietoaineiston avaamisen yhteydessä mahdollista avata myös tietoaineiston tuotantoprosessi (laskentasäännöt, algoritmit tms.).
Lisätietoa aiheesta löydät data.europa.eu-palvelusta:
Hyödyt, riskit ja kustannukset
Tässä vaiheessa kuvataan, miten organisaatio voi arvioida avattavaksi suunnitellun tietoaineiston avaamisesta mahdollisesti syntyviä hyötyjä, riskejä ja kustannuksia. Hyötyjen, riskien ja kustannusten arviointiin kehitetyn työkalun voit ladata käyttöösi osiosta Menetelmä tiedon avaamisen hyötypotentiaalin, riskien ja kustannusten arviointiin.
Tiedonhallintalautakunta on antanut suosituskokoelman tiettyjen tietoturvasäännösten soveltamisesta (valtiovarainministeriön julkaisuja 2021:65), jonka mukaan tietoriskien hallinta on jatkuvaa toimintaa, johon liittyvät tavoitteet, periaatteet, vastuut ja keskeiset menettelyt tiedonhallintayksikön on hyvä kuvata. Johdon vastuulla on tietoriskien hallinnan organisointi ja resursointi. Lisäksi tiedonhallintayksikkö ylläpitää riskiarvioiden tuloksista ja riskienkäsittelysuunnitelmista muodostuvaa tietoaineistoa sekä arvioi säännöllisesti, onko se osin tai kokonaan salassa pidettävä tai turvallisuusluokiteltava.
Tiedonhallintolautakunta on antanut myös suosituksen julkisen hallinnon tietoturvallisuuden arviointikriteeristöstä (Julkri), johon sisältyy ohjeistus sen käytöstä (valtiovarainministeriön julkaisuja 2022:43). Arviointikriteeristö tukee koko julkishallinnon tietoturvallisuuden kehittämisen ja arvioinnin tarpeita. Sitä voidaan käyttää apuna arvioitaessa tiedonhallintalakia, turvallisuusluokitteluasetusta sekä osin myös arvioitaessa tietosuoja-asetuksen säädettyjen tietoturvallisuutta koskevien vaatimusten täyttymistä.
Tietosuojan varmistaminen
Tässä vaiheessa kuvataan avattavan tietoaineiston aggregointi- ja anonymisointitarpeiden arviointia sekä organisaatiokohtaisia käytänteitä avattavan tietoaineiston tietosuojan varmistamiseen ja mahdollisesti tarvittavan aggregoinnin, anonymisoinnin tai pseudonymisoinnin toteuttamiseen.
Tiedon aggregointi- ja anonymisointitarpeiden arviointiin ei ole olemassa virallisia suosituksia.
Tietoa jo avanneissa organisaatioissa on lähtökohtaisesti arvioitu hyvin huolellisesti, onko jaettavaksi suunniteltu tietoaineisto julkinen ja pitääkö se mahdollisesti sisällään henkilötietoja tai muuta yhteiskunnan toimivuuden kannalta kriittistä tietoa. Mikäli avattavaksi suunniteltu tietoaineisto sisältää jollain tapaa ihmisiin tai yhteiskunnan turvallisuuteen liittyvää tietoa, on tietoaineiston avaamisesta ja mahdollisesta aggregoinnista, anonymisoinnista tai pseudomymisoinnista syytä keskustella organisaation tietosuojavastaavan kanssa. Muutenkin tietoaineiston aggregointi- ja anonymisointitarpeiden arvioinnissa kannattaa konsultoida organisaation tietosuojavastaavaa, muita tietosuoja-asioiden asiantuntijoita tai verkostoja.
Julkisuusperiaatteen (julkisuuslaki 621/1999) mukaisesti viranomaisten asiakirjat ovat julkisia, jollei julkisuuslaissa tai muussa laissa erikseen toisin säädetä. On kuitenkin tärkeää huomioida, että julkinen asiakirja voi pitää sisällään henkilötietoja ja henkilötiedon luovuttaminen vaatii aina lain mukaisen perusteen, vaikka kyseessä olisikin julkinen asiakirja. Viranomaisen tulee arvioida, voidaanko asiakirjassa oleva henkilötieto luovuttaa. Julkinen tieto ei siis välttämättä tarkoita, että tiedon voi julkistaa, sillä julkisessa asiakirjassa voi olla henkilötietoa, jota ei voi julkistaa, vaikka kyse ei ole salassapidosta. Salassapito edellyttää julkisuuslain mukaista salassapitoperustetta ja salassapitosäännöksiä on myös erityislainsäädännössä.
Henkilötiedot on mahdollista poistaa tietoaineistoista anonymisoinnilla. On kuitenkin huomioitava, että niin pitkään, kun tietojen perusteella voi tunnistaa henkilön suoraan tai tiedot voidaan palauttaa takaisin tunnistettavaan muotoon, ne ovat yhä henkilötietoja ja niihin sovelletaan tietosuoja-asetusta.
Anonymisointi tarkoittaa henkilötietojen käsittelyä niin, että henkilöä ei enää voida tunnistaa niistä. Tiedot voidaan esimerkiksi karkeistaa yleiselle tasolle (aggregoida) tai muuttaa tilastolliseen muotoon siten, etteivät yksittäistä henkilöä koskevat tiedot ole enää tunnistettavassa muodossa. Tunnistamisen täytyy estyä peruuttamattomasti ja siten, että rekisterinpitäjä tai muu ulkopuolinen taho ei voi enää hallussaan olevilla tiedoilla muuttaa tietoja takaisin tunnistettaviksi.
Pseudonymisointi tarkoittaa henkilötietojen käsittelemistä siten, että henkilötietoja ei voida enää yhdistää tiettyyn henkilöön ilman lisätietoja. Tällaiset lisätiedot täytyy säilyttää huolellisesti erillään henkilötiedoista.
Tietosuojavaltuutetun toimisto on kansallinen valvontaviranomainen, joka valvoo tietosuojalainsäädännön noudattamista. Tietosuojavaltuutettu ja apulaistietosuojavaltuutetut ovat tehtävässään itsenäisiä ja riippumattomia. Tietosuojavaltuutetun toimistoon on sijoitettu asiantuntijalautakunta (toimikausi on 1.10.2020–30.9.2023), jonka tehtävänä on antaa lausuntoja henkilötietojen käsittelyä koskevan lainsäädännön soveltamiseen liittyvistä merkittävistä kysymyksistä tietosuojavaltuutetun pyynnöstä. Lisätietoja tietosuojavaltuutetun toimiston verkkosivuilta.
EU:n yleisen tietosuoja-asetuksen mukaan tiettyjen rekisterinpitäjien ja henkilötietojen käsittelijöiden on nimitettävä tietosuojavastaava. Velvoite koskee kaikkia viranomaisia ja julkishallinnon elimiä. Tietosuojavastaava antaa neuvoja tietosuojaan liittyen rekisterinpitäjälle ja henkilötietoja käsitteleville työntekijöille. Hän seuraa asetuksen noudattamista sekä tietosuojaan liittyvän tiedottamisen ja koulutuksen toteutumista omassa organisaatiossaan. Tietosuojavastaava neuvoo vaikutustenarviointeihin liittyen ja toimii valvontaviranomaisen yhteyspisteenä.
Tutustu tarkemmin:
- Data.europa.eu:n datan hallinnoinnin ja tietosuojan haasteista
- Kyberturvallisuuskeskuksen raportti: Tunnisteet ja tietosuoja anonymisointi ja sen rajat (pdf).
Jakelu- ja tiedostomuodon valinta
Tässä vaiheessa kuvataan, missä muodoissa tietoa voi jakaa ja mitä muotoa valittaessa kannattaa huomioida.
Avattavan tiedon jakelu- ja tiedostomuodon määrittelyyn ei ole olemassa virallisia suosituksia.
Valitessa tietoaineiston jakelutapaa on huomioitava tietojen saantioikeuksista, tietojen luovutuksista ja tietojen tarjoamisesta koneellisesti luettavassa muodossa säädetyt lait ja niiden asettamat velvoitteet, kuten tiedonhallintalain pykälät 22 ja 24. Lisäksi tulee huomioida tietoaineistoille mahdollisesti tarvittavat muokkaukset kuten pseudonymisointi tai anonymisointi.
Tietoa jo avanneissa organisaatioissa on jaettu tietoa tiedostoina, ohjelmointirajapintojen kautta tai latauspalvelun kautta. Tiedon jakamisen tekninen toteutus riippuu pitkälti siitä, minkälaisia jakeluratkaisuja tietojärjestelmään on kehitetty. Järjestelmästä voi saada tietoa ulos tiedostomuodossa eräajotyyppisenä raporttina ja/tai ohjelmointirajapinnan kautta. Vanhempiin tietojärjestelmiin on harvemmin kehitetty tai kehitettävissä ohjelmointirajapintaa, joten tiedon jakaminen voi olla mahdollista vain eräajotiedostoina. Mikäli mahdollista, on tietoaineisto hyvä jakaa useammassa eri muodossa, esimerkiksi rajapinnan lisäksi on tarjolla tiedosto.
Avoimen datan julkaisemisessa on hyvä käyttää avoimia dataformaatteja eli tiedostomuotoja aina kun mahdollista. Lisätietoja avoimen tiedostomuodon valinnasta (englanniksi) data.europa.eu-palvelussa.
Mikä jakelutapa sopii millaisellekin datalle?
Esimerkkejä organisaatioiden jakelutavoista
Tiedon laadun määrittely
Tässä vaiheessa kuvataan, miten avattavan tietoaineisto laatua voi arvioida, määrittää ja kuvata.
Avattavan tietoaineistoon laadun määrittelyyn ei ole olemassa virallisia suosituksia.
Tietoa jo avanneet organisaatiot ovat pyrkineet kuvaamaan tietoaineiston kuvailu- eli metatiedoissa arvionsa tietoaineiston sen hetkisestä laadusta mahdollisine heikkouksineen. Esimerkiksi avoindata.fi-palvelussa tiedon laatuarvion voi kirjoittaa tietoaineiston metatietojen Kuvaus-kenttään tai lisätä selvityksen erillisenä data-aineistona PDF-muodossa.
On tärkeää huomioida, että vaikka avattavan tietoaineiston laatu ei ole niin hyvä kuin tietoa hallinnoiva taho tai sidosryhmät toivovat, se ei välttämättä estä tiedon jakamista. Tietoaineiston voi jakaa korostaen metatiedoissa tiedon laatuun liittyviä heikkouksia.
Tietoaineiston laadun arvioinnissa ja kuvaamisessa voi hyödyntää julkishallinnon yhteisiä tiedon laatukriteereitä ja mittareita, jotka on kehitetty tukemaan julkisen hallinnon tiedon laadun parantamista.
Käyttöoikeuksien määrittely
Tässä vaiheessa kuvataan, miten avattava tieto kannattaa lisensoida eli millaisin käyttöehdot avatun tiedon hyödyntämiselle kannattaa asettaa.
Avattavan tietoaineistoon käyttöoikeuksien määrittelyyn ei ole olemassa virallisia suosituksia.
Datan käyttöoikeudet määritellään valitsemalla datalle sopiva lisenssi, joka kertoo datan hyödyntäjille, millä ehdoin julkaistua tietoa voi hyödyntää. Lisenssi pitää mainita julkaistavan tietoaineiston metatiedoissa.
Miten avatulle tiedolle valitaan sopiva käyttölupa?
Jotta jaettua tietoa voidaan pitää avoimena tietona, se vaatii avoimen lisenssin eli lisenssin, joka sallii tietoaineiston vapaan levittämisen, muokkauksen ja käytön kaikkiin, myös kaupallisiin, tarkoituksiin. Täysin avoin lisenssi (esimerkiksi CC0) tarkoittaa luopumista lainsäädännön rajoissa kaikista hyödyntämistä rajoittavista tekijänoikeuksista.
Avoimena datana julkaistavat tietoaineistot lisensoidaan yleensä Creative Commonsin CC BY 4.0 tai CC0 -lisenssillä. Suomessa ei ole tällä hetkellä kansallista suositusta julkisen hallinnon avoimien tietoaineistojen lisensoinnille, mutta aiemmin käytössä ollut JHS-189 Avoimen tietoaineiston käyttölupa suositteli käytettäväksi CC BY 4.0 -lisenssiä.
Yleisimmät avoimen tiedon lisenssit
Esimerkki vastuuvapauslausekkeesta
Joskus lisenssin lisäksi voi olla tarvetta rajata vastuuta datan hyödyntäjiin nähden vastuuvapauslausekkeella.
Organisaation nimi ei ole vastuussa menetyksistä, oikeudenkäynneistä, vaateista, kanteista, vaatimuksista, tai kustannuksista taikka vahingosta, olivat ne mitä tahansa tai aiheutuivat ne sitten miten tahansa, jotka johtuvat joko suoraan tai välillisesti yhteydestä Organisaation nimi julkaisemaan avoimeen dataan tai Organisaation nimi julkaiseman avoimen datan käytöstä.
Miksi kannattaa käyttää Creative Commons -lisenssejä?
Creative Commons -lisenssien kanssa on etukäteen tiedossa, miten esimerkiksi erilaisissa datan käyttöoikeuksia koskevissa riitatilanteissa toimitaan. On tärkeää, ettei lisenssejä luoda itse, koska niiden oikeuskäytäntöä ei pysty ennalta arvaamaan.
Tunnettujen lisenssien käytöstä on hyötyä myös datan hyödyntäjille:
- Creative Commons lisenssit ovat kansainvälisesti tunnettuja, joten ne mahdollistavat datan hyödyntämisen yli maaraajojen.
- Datoja on helpompi yhdistellä ja uudelleenkäyttää, kun niillä on samanlaiset, tutut käyttöehdot.
Tiedon avaamisesta päättäminen
Tässä vaiheessa kuvataan, miten organisaatiossa voidaan menetellä tiedon avaamisesta päättämisessä.
Tietoaineistojen avaamisesta päättämiseen ei ole olemassa virallisia suosituksia.
Suomen lainsäädännön mukaan tietoaineiston avaamisesta päättää sen viranomaistaho, jolle on annettu lainsäädännössä tehtävä hallinnoida tietoa. Esimerkiksi Terveyden ja hyvinvointilaitoksen (THL) hallinnoimien tietoaineistojen avaamisesta avoimena datana päättää THL. Suomessa ei ole keskitettyä tahoa, joka päättäisi keskitetysti koko hallinnon tietojen avoimuudesta.
Tietoa avataan, jotta joku hyödyntää sitä. Usein organisaatiot tietävät ainakin joitakin asiakkaita, jotka voisivat hyödyntää avattavaa tietoa ja näkevät siinä arvoa. Näiden mahdollisten tiedon hyödyntäjien kanssa kannattaa arvioida tiedon avaamisen luomia mahdollisuuksia esimerkiksi työpajassa. Pohjatiedoiksi tarvitaan kuvaus siitä, mitä tietoa organisaatio voisi avata. Organisaatioilla on usein paljon tietoa ja vain pieni osa tiedoista voidaan avata kerralla.
Samalla on hyvä päättää mahdollisten jäännösriskien hallinnasta. Jäännösriskillä tarkoitetaan riskiä tai riskin osaa, joka jää voimaan tai jolle ei voi tai haluta tehdä toimenpiteitä. Lisätietoja jäännösriskeistä riskienhallinnan ohjeessa.
Mikäli organisaatio aikoo avata useita tietoaineistoja, voi organisaation olla tarpeen priorisoida tietoaineistojen avaamisjärjestystä ja kehitystoimia.