Datan ominaisuudet vaikuttavat prosessin myöhempiin vaiheisiin. Samalla kun käyt läpi organisaatiosi tuottamaa dataa, luokittele data sen ominaisuuksien perusteella esimerkiksi seuraavanlaisesti. Voit käyttää tätä luokittelua apuna datan avaamisen priorisoinnissa.
Staattinen ja dynaaminen data
Staattinen data muuttuu harvoin ja vähän. Dataa saatetaan päivittää esimerkiksi kerran vuodessa tai muutaman vuoden välein riippuen siitä, minkälaisesta datasta on kyse. Esimerkiksi vuosittain päivitettävät tilinpäätöstiedot ovat staattista tietoa, samoin kuin hyvin harvoin muuttuvat postinumeroalueet. Staattista dataa sisältävän aineiston voi ladata kertaalleen, minkä jälkeen ladattua kopiota voi käyttää pitkään.
Dynaaminen data taas muuttuu usein tai jopa jatkuvasti. Datasta haetaan aina tuorein versio. Dynaamista dataa ovat esimerkiksi bussien ja junien reaaliaikaiset sijainnit sekä sääennusteet.
Järjestelmälle asetettavat tekniset laatuvaatimukset ovat staattisen datan kohdalla pienemmät kuin dynaamisen datan kohdalla. Jos vuosittain päivitettäviä tilinpäätöstietoja jakava palvelin on toisinaan muutaman tunnin ajan pois käytöstä, hyödyntäjälle aiheutuu usein vain vähäistä haittaa. Jos sen sijaan bussien reaaliaikaiset sijainnit lakkaavat päivittymästä, joukko muitakin palveluita muuttuu toimintakyvyttömiksi ja pahimmillaan koko kaupunki ruuhkautuu.
Myös riskitasoissa on eroja. Arkaluontoisen staattisen datan, kuten henkilökohtaisten sairaustietojen, jakamista vahingossa ei voi perua. Kerran ladattu data pysyy lataajilla. Jos taas dynaamista dataa julkaistaan vahingossa, tilanteen voi yleensä korjata sulkemalla dataa luovuttavan rajapinnan.
Julkaisuvalmis data ja raakadata
Julkaisuvalmis data on loogisiksi kokonaisuuksiksi koostettua dataa. Sitä käytetään usein jo johonkin tarkoitukseen organisaation sisällä.
Vaikka data olisi jo käytössä organisaation sisällä, on silti hyvä käydä avaamisprosessi huolella läpi. Varmista datan laatu ja suodata pois arkaluontoinen materiaali ennen sen avaamista.
Raakadata taas on dataa, jota organisaatiollasi on, mutta jota ei ole vielä koottu yhteen paikkaan. Raakadatan avaaminen vaatii enemmän työtä kuin julkaisuvalmiin datan.
Julkaisuvalmis data kannattaa yleensä avata ensin. Jos kuitenkin raakadata on julkaisuvalmista dataa paljon arvokkaampaa, on kannattavaa avata raakadata ensin.
Itse tuotettu data ja koostettu data
Osa organisaatiossasi käytössä olevasta datasta on syntynyt sen sisällä, kun taas osa koostuu ulkoisista lähteistä saaduista datoista, joita yhdistellään ja jatkojalostetaan. Varmista että saat jakaa muualta saatua dataa osana organisaatiosi datan avaamista. Varmista myös, että organisaatio, jolta saat dataa, ei jo jaa kyseistä dataa avoimena datana. Ei siis kannata avata uudestaan jo avattua dataa. Jos organisaatiosi yhdistelee jo avattua dataa oman datansa kanssa, kannattaa yhdistetty data julkaista, sillä datan yhdistely tuo lisäarvoa.
Liikenneviraston onnettomuustilastot perustuvat poliisin kirjaamiin onnettomuustietoihin, joita täydennetään Liikenteen turvallisuusviraston sekä Tilastokeskuksen tiedoilla. Tietojen sisällöstä ja laadusta vastaa Tilastokeskus, josta onnettomuustiedot saadaan kerran kuukaudessa. Liikennevirastossa onnettomuustietoihin liitetään tierekisteristä tapahtumapaikan tie- ja liikenneoloja kuvaavat tiedot.