Viimeistele datan avaaminen

Datasi on lähes valmista julkaistavaksi. Viimeisenä asiana ennen julkaisua sinun kannattaa kirjoittaa avatulle datalle metatiedot sekä tehdä arvio datan laadusta.

Datan avaamisen viimeisteleminen

Metatiedot

Metatiedot eli kuvailutiedot antavat datan käyttäjille, niin ihmisille kuin koneillekin, hyödyllistä lisäinformaatiota tietoaineistosta. Metatietojen avulla kuvailet muun muassa datan alkuperää, sen rakennetta sekä datan käyttöön kohdistuvia oikeuksia ja lisenssejä. Julkaistessasi dataa internetissä sen alkuperäinen konteksti katoaa helposti, jolloin on erityisen tärkeää tarjota käyttäjälle metatietoja. Kattavilla metatiedoilla edistät datasi löydettävyyttä sekä uudelleenkäyttöä. Avoindata.fi käyttää DCAT-AP 2.0 -tietomallia metatiedoille.

Metatiedot kannattaa tarjota sekä suomeksi että englanniksi, sekä mahdollisuuksien mukaan ruotsiksi. Erityisesti englanninkielisistä metatiedoista on hyötyä mahdollisille kansainvälisille datan hyödyntäjille. Avoindata.fi-palveluun ladatut tietoaineistot harvestoidaan Euroopan dataportaaliin, joten data tavoittaa myös kansainvälistä yleisöä.

Suosittelemme tarjoamaan ainakin seuraavanlaista metatietoja. Metatietojen tulisi olla saatavilla sekä ihmis- että koneluettavassa formaatissa.

DCAT-AP-tietomallin metatiedot

DCAT-AP on EU-maiden yhteinen sopimus siitä, mitä metatietoja avoimen datan tietoaineistoista tulisi tarjota. Se perustuu W3C:n luomaan DCAT-standardiin. Avoindata.fi on luonut oman laajennoksensa DCAT-AP:sta, jonka tekniset tiedot löydät palvelustamme (englanniksi). Laajennoksen ansiosta myös avoindata.fi on DCAT-AP yhteensopiva, palvelun haku toimii paremmin ja tietoaineistot löytyvät helposti myös Euroopan dataportaalista, jonne ne harvestoidaan. Lue lisää DCAT-AP:sta ja avoindata.fi:n laajennoksesta DCAT-AP-sivultamme.

Kun lataat dataa avoindata.fi-palveluun, täytä vähintään pakolliset metatietokentät. Nämä metatiedot näytetään käyttäjälle tietoaineistosi ja data-aineistosi sivuilla. Voit halutessasi lisätä tietoaineistolle myös erillisen tekstitiedoston, jossa tarjoat enemmän metatietoja käyttäjälle.

Kuvailevat metatiedot

Kuvaileva metatieto on tarkoitettu datan ominaisuuksien kuvailuun. Koneluettavassa muodossa oleva metatieto parantaa lisäksi datan löydettävyyttä.
Määrittele ainakin tietoaineiston otsikko, aineistoon liittyvät avainsanat, julkaisupäivä ja kategoria, johon tietoaineisto kuuluu. Kuvaile lisäksi tietoaineiston sisältö ja käyttötarkoitus helposti ymmärrettävässä muodossa.

Sijaintitietoihin perustuvat metatiedot

Sijaintitietoihin perustuva metadata, kuten päivämäärä, aika ja kieli, edistää datan uudelleenkäyttöä. Kun määrittelet esimerkiksi tietoaineiston kielen sen metatiedoissa, helpotat datan mahdollisten kansainvälisten käyttäjien työtä. He pystyvät metatiedon avulla arvioimaan, onko heidän mahdollista hyödyntää dataa.

Laatuarvio

Julkaise lisäksi käyttäjille oma arviosi datan sen hetkisestä laadusta ja kerro sen alkuperästä. Tämä parantaa avaamasi datan laatua ja uskottavuutta. Voit kirjoittaa lyhyen laatuarvion tietoaineiston metatietojen Kuvaus-kenttään tai lisätä pidemmänkin selvityksen tietoaineistoosi erillisenä data-aineistona esimerkiksi PDF-muodossa. Anna myös käyttäjille mahdollisuus datan laadun arviointiin ja huomioi nämä arviot laatua parannettaessa.

Voit kertoa laatuarviossa käyttäjälle tarinan datan alkuperästä ja keräystavasta. Voit lisäksi antaa esimerkkejä siitä, mihin dataa voisi mahdollisesti käyttää — tällä tavoin voit inspiroida sovelluskehittäjiä ja lisätä datasi käyttöä erilaisissa avointa dataa hyödyntävissä käyttösovelluksissa.

Euroopan komission Open Data Support -projekti suosittelee pohtimaan seuraavia asioita datan laatua arvioidessa:

  • Tarkkuus: Onko tietoaineisto riittävän tarkka esitys jostakin kokonaisuudesta? Datan tulisi olla tarpeeksi yksityiskohtaista sen käyttötarkoitukseen.
  • Yhtenäisyys: Eihän datassa ole ristiriitoja? Varmista, ettei datassa tai sen metatiedoissa ole esimerkiksi asiavirheitä.
  • Saatavuus: Onko data saatavilla nyt ja tulevaisuudessa? Huolehdi datan ylläpidosta.
  • Täydellisyys: Sisältääkö tietoaineisto kaiken kokonaisuutta kuvaavan datan? Tietoaineiston tulisi sisältää riittävästi dataa käyttötarkoitukseensa nähden.
  • Säännönmukaisuus: Vastaako tietoaineisto hyväksyttyjä standardeja? Käytä oman alasi yleisimpiä standardeja datan ja metatietojen laadun varmistamiseksi.
  • Uskottavuus: Perustuuko data luotettaviin lähteisiin? Käytä luotettavia lähteitä ja kerro käyttäjälle niistä.
  • Koneluettavuus: Onko data koneluettavaa? Julkaise data ja metatiedot myös koneluettavassa muodossa.
  • Rajaus: Sisältääkö tietoaineisto tarkoituksenmukaisen määrän dataa? Pohdi datan mahdollisia käyttötarkoituksia. Määrittele datan tarkkuus ja määrä niiden perusteella.
  • Ajankohtaisuus: Onko tietoaineiston sisältämä data ajankohtaista? Määrittele datan päivitysnopeus tietoaineiston tyypin ja sen käyttötarkoituksen perusteella.