Kommentoi arvokkaiden tietoaineistojen luonnosta 21.6. mennessä

EU:n komissio kerää palautetta luonnoksesta arvokkaista tietoaineistoista (englanniksi High Value Datasets, HVD). Säädöksen tarkoituksena on, että tiettyihin aihealueisiin liittyvä data avattaisiin kaikissa EU-maissa mahdollisimman yhtenäisellä tavalla.

Mitä hyötyä arvokkaiden tietoaineistojen määrittelemisestä on?

Yksi suurimpia ongelmia datan saatavuudessa Euroopassa on saman tiedon saatavuus samalla tavalla koko EU:n alueelta. Dataa on usein saatavilla eri muodoissa eri maissa. Esimerkiksi Suomessa tieto voi olla saatavilla tiedostona, Ruotsissa ohjelmointirajapinnan kautta ja jossain muussa maassa samat tiedot eivät ole lainkaan saatavilla avoimesti. Voi myös olla, että aineistoista puuttuu tietoja, tai siitä ei ole tarjolla tarpeeksi metatietoja, kuten käyttöehtoja kertovaa lisenssiä, jotta aineistoa voisi joku hyödyntää. Käytännössä on usein vaikeaa luoda avointa dataa hyödyntäviä sovelluksia, jotka toimisivat koko EU:n alueella. Taloudellisesti tämä olisi kuitenkin tärkeää.

Ratkaisuna tähän ongelmaan on esitetty säädöstä arvokkaista tietoaineistoista, joka liittyy direktiiviin avoimesta datasta ja julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä. Säädöksen mukaan julkisen sektorin tuottama data tietyistä arvokkaiksi määritellyistä aihealueista pitäisi avata samalla tavalla kaikissa EU-maissa, eli esimerkiksi yritystiedot olisivat saatavilla samassa muodossa ja samassa laajuudessa rajapinnan kautta kaikissa EU-maissa. Jos koko Euroopan yritystiedot olisivat avoimesti kaikkien saatavilla, tiedettäisiin, mitä yrityksiä Euroopassa on olemassa, mikä lisäisi yritysten keskinäistä luottamusta ja siten myös liiketoimintaa. 

Lisäksi maiden rajoja ylittäviä sovelluksia olisi helpompaa kehittää, jos yhteentoimivaa dataa olisi saatavilla. Toisin sanoen avointa dataa hyödyntävien sovellusten markkinat kasvaisivat hurjasti. Esimerkiksi sovellus, joka on ennen toiminut vain Suomessa voisikin toimia koko Euroopan laajuisesti.  

Kommentoi luonnosta tiistaihin 21.6. mennessä

Nyt EU-komission valmistelema luonnos arvokkaista tietoaineistoista on avattu kommenteille. Kommentoida voi kuka vaan, joten käy kertomassa mielipiteesi säädöksestä ja siinä määritellyistä datakategorioista. Onko esimerkiksi tietoaineistojen määrittely toimiva ja vaikuttavatko tiedot helpoilta hyödyntää? Erityisesti kannattaa tutustua säädöksen liitteeseen (Annex), sillä se määrittelee kuhunkin kategoriaan kuuluvat aineistot ja kriteerit niiden avaamiselle. 

Löydät luonnoksen ja pääset kommentoimaan tästä linkistä (englanniksi). Voit kommentoida tiistaihin 21.6 asti

Arvokkaiden tietoaineistojen säädös lyhyesti 

Tavoitteena: Julkisin varoin tuotettu tieto olisi avoimesti saatavilla, ja sitä voitaisiin hyödyntää uusissa palveluissa ja tuotteissa erityisesti tekoälyä käyttämällä. 

Julkisen sektorin tuottamien arvokkaiden tietoaineistojen tulisi olla saatavilla maksuttomasti koneluettavassa muodossa ja tarjolla ohjelmointirajapintojen (API) kautta ja tarvittaessa myös useana kerralla ladattavana tiedostona (bulk download).

Arvokkaat tietoaineistot kuuluisivat seuraaviin kategorioihin:

  1. Paikkatiedot (geospatial)
  2. Maanhavannointi ja ympäristötiedot (earth observation and environment)
  3. Säätiedot (meteorological)
  4. Tilastotiedot (statistics)
  5. Yritykset ja yritysten omistustiedot (companies and company ownership)
  6. Liikkuvuustiedot (mobility)

Kuhunkin kategoriaan kuuluva data ja sen muoto on määritelty tarkemmin säädöksen liitteessä. 

Säädöksen mukaan avattu data tulisi lisensoida käyttöluvalla, joka ei rajoita aineiston uudelleenkäyttöä. Esimerkiksi Creative Commonsin CC BY 4 -käyttölupa on hyvä esimerkki tällaisesta lisenssistä. Eri kategorioihin kuuluvalle datalle saatetaan suositella eri käyttölupaa. 

Lisää tietoa säädöksestä löydät esimerkiksi valtiovarainministeriön Tunnistatko avoimet tietoaineistot -tilaisuuden esitysmateriaalista (pdf)