Väestötietojärjestelmän suomalaisten nimiaineistot

Väestötietojärjestelmästä on poimittu erilliset etunimiä ja sukunimiä koskevat nimiluettelot ja nimien kappalemääräiset esiintymät väestötietojärjestelmässä. Tietosuojasyistä etunimiä, joita on alle 10 kappaletta ja sukunimiä, joita on alle 20 kappaletta, ei esitetä luetteloissa.

Etunimiaineisto on jaettu miesten ja naisten nimiksi sen mukaisesti, miten nimet esiintyvät väestötietojärjestelmässä eri sukupuolta olevilla henkilöillä. Etunimistä on muodostettu erilliset miesten ja naisten nimiä koskevat luettelot, joista ensimmäinen kuvaa kaikkien etunimien esiintymiä, toinen nimen esiintymistä ensimmäisenä etunimenä ja kolmas nimen esiintymistä muuna kuin ensimmäisenä etunimenä.

Sukunimiaineistossa on lueteltu sukunimet esiintymien lukumäärän mukaisessa suuruusjärjestyksessä.

Nimiaineistot on muodostettu suomalaisten voimassaolevien nimien pohjalta, joten niissä on huomioitu väestötietojärjestelmään rekisteröityjen elossa olevien Suomessa tai ulkomailla asuvien Suomen kansalaisten nimistö. Ulkomaiden kansalaisten, kuolleiden henkilöiden nimiä tai henkilöiden entisiä nimiä ei ole huomioitu. Välinimet on laskettu aineistossa etunimiksi, samoin erisnimen sisältävät patronyymit ja matronyymit kuten Matinpoika tai Maijantytär. Sen sijaan patronyymejä, jotka ainoastaan viittaavat toiseen erisnimeen olematta itse erisnimiä kuten ibn, bin, ben ei ole aineistossa lueteltu.

Nimen kirjoitusasusta riippuen mm. nimen vokaalipaino voi olla eri kohdassa. Nämä painotukset ovat näkyvillä aineistossa, jolloin esim. Viren ja Virén esiintyvät aineistossa omina niminään. Myös avioliiton kautta syntyneet yhdistelmänimet, esim. Korhonen-Virtanen, esiintyvät aineistossa tässä yhdistelmämuodossa, mikäli niitä on yli 20 kappaletta.

Nimiaineistot on poimittu syyskuussa 2016.

Nimiaineisto on CSV-tiedostomuodossa. Lisäksi jokaisesta luettelosta on laadittu PDF-muotoinen lyhennelmä, jossa on tuhat yleisintä nimeä.

Resources (14)

Related Components (0) Add Related Component

Do you know apps based on this dataset? Add them by logging in.

Extra information

Author
pekkpa
Maintainer
Pauli Pekkanen
Owner
Väestörekisterikeskus
License
Creative Commons Attribution 4.0
Metadata created
2014-10-14T12:00:01.939669
Metadata modified
2016-10-17T08:09:22.792454
Isopen
True
URL
None
Private
False
Revision id
eac5a3db-5c29-458f-9c88-20960fdd740a
Qa
[{'openness_score_reason': Markup(u'This file had not been downloaded at the time of scoring it. URL extension "csv" relates to format "CSV" and receives score: 3.')}, {'updated': Markup(u'2017-04-28T02:47:12.986663')}, {'openness_score': Markup(u'3')}]
Content type
Avoin data
Archiver
[{'status': Markup(u'System error during archival')}, {'is_broken': Markup(u'None')}, {'reason': Markup(u'No value for ckanext-archiver.cache_url_root in config')}, {'status_id': Markup(u'23')}]
Author email
pauli.pekkanen@vrk.fi
Creator user id
631f08fe-41e3-4c1f-99d4-4ee20ce5ba7b
Id
57282ad6-3ab1-48fb-983a-8aba5ff8d29a
Maintainer email
pauli.pekkanen@vrk.fi
Tracking summary
[{'total': Markup(u'3065')}, {'recent': Markup(u'563')}]

Comments

Nimiaineiston Power BI -visualisointi

Kiitos tästä aineistosta!

Laadin siitä visualisoinnin ilmaisella Power BI Desktop -välineellä:

https://hexcelligent.fi/2016/11/23/miten-suosittu-etu-tai-sukunimesi-on/

Olisi hienoa, jos aineistosta julkistettaisiin myös versio, missä olisi annettujen etunimien lukumäärät syntymävuosien perusteella.



Login to comment.
Open Data
avoin data
Feedback
Resource Quality
Metadata Quality

Väestötietojärjestelmän suomalaisten nimiaineistot

Followers
0
Last 30 days, updated daily
All time visits: 68123
All time downloads: 19692
Last Modified: 17.10.2016
Created: 14.10.2014

Show change log >