Finna-koulutuskorpukset

Aineisto koostuu koneoppimisessa käytettäväksi tarkoitetuista TF-IDF-datamatriiseista. Matriisit on koostettu dokumenttikorpuksista, jotka perustuvat metadataan, joka on haettu Finna.fi palvelusta sen avoimen rajapinnan kautta vuonna 2019. Korpukset ovat suomen, ruotsin ja englannin kielillä.

Dataresurser (6)

Mer information

Den ansvarigas e-post
  1. analytics@csc.fi
Den ansvarigas webbplats
Länkar till mer information
  1. https://github.com/NatLibFi/Annif-corpora/tree/master/training/2019
Geografisk täckning
Uppdateringsfrekvens
Giltig fr.o.m.
Giltig t.o.m.
Last modified 26.02.2021
Visa ändringslogg
Created on 24.02.2021

Give feedback

comments powered by Disqus