Finna-koulutuskorpukset


Aineisto koostuu koneoppimisessa käytettäväksi tarkoitetuista TF-IDF-datamatriiseista. Matriisit on koostettu dokumenttikorpuksista, jotka perustuvat metadataan, joka on haettu Finna.fi palvelusta sen avoimen rajapinnan kautta vuonna 2019. Korpukset ovat suomen, ruotsin ja englannin kielillä.

Data-aineistot (6)

Lisätiedot

Kenttä Arvo
Avainsanat
Tietoaineiston näkyvyys
Vanhentunut Ei
Lisätietoa lisenssistä

Koulutusmatriisit on tuottanut CSC - Tieteen tietotekniikan keskus Oy. Alkuperäisen datan on kerännyt Kansalliskirjasto.

Maantieteellinen kattavuus
Päivitystiheys
Voimassa alkaen
Voimassa päättyen
Lisätietoa verkossa
  1. https://github.com/NatLibFi/Annif-corpora/tree/master/training/2019
Tietoaineiston tyyppi Open data
Kansainväliset vertailut
Tila Aktiivinen
Tietoaineiston ylläpitäjä Analytiikkaryhmä
Ylläpitäjän sähköpostiosoite analytics@csc.fi
Ylläpitäjän verkkosivu
comments powered by Disqus