Aineisto koostuu koneoppimisessa käytettäväksi tarkoitetuista TF-IDF-datamatriiseista. Matriisit on koostettu dokumenttikorpuksista, jotka perustuvat 7400:aan Jyväskylän yliopiston digitaalisesta tietovarannosta...
Yritys
TXT