Väestötietojärjestelmän suomalaisten nimiaineistot

Väestötietojärjestelmästä on poimittu erilliset etunimiä ja sukunimiä koskevat nimiluettelot ja nimien kappalemääräiset esiintymät väestötietojärjestelmässä. Tietosuojasyistä etunimiä, joita on alle 10 kappaletta ja sukunimiä, joita on alle 20 kappaletta, ei esitetä luetteloissa.

Etunimiaineisto on jaettu miesten ja naisten nimiksi sen mukaisesti, miten nimet esiintyvät väestötietojärjestelmässä eri sukupuolta olevilla henkilöillä. Etunimistä on muodostettu erilliset miesten ja naisten nimiä koskevat luettelot, joissa on erikseen nimien lukumäärät yhteensä kaikkina etuniminä, ensimmäisenä etunimenä tai muuna kuin ensimmäisenä etunimenä.

Sukunimiaineistossa on lueteltu sukunimet esiintymien lukumäärän mukaisessa suuruusjärjestyksessä.

Nimiaineistot on muodostettu suomalaisten voimassaolevien nimien pohjalta, joten niissä on huomioitu väestötietojärjestelmään rekisteröityjen elossa olevien Suomessa tai ulkomailla asuvien Suomen kansalaisten nimistö. Ulkomaiden kansalaisten, kuolleiden henkilöiden nimiä tai henkilöiden entisiä nimiä ei ole huomioitu. Välinimet on laskettu aineistossa etunimiksi, samoin erisnimen sisältävät patronyymit ja matronyymit kuten Matinpoika tai Maijantytär. Sen sijaan patronyymejä, jotka ainoastaan viittaavat toiseen erisnimeen olematta itse erisnimiä kuten ibn, bin, ben ei ole aineistossa lueteltu.

Nimen kirjoitusasusta riippuen mm. nimen vokaalipaino voi olla eri kohdassa. Nämä painotukset ovat näkyvillä aineistossa, jolloin esim. Viren ja Virén esiintyvät aineistossa omina niminään. Myös avioliiton kautta syntyneet yhdistelmänimet, esim. Korhonen-Virtanen, esiintyvät aineistossa tässä yhdistelmämuodossa, mikäli niitä on yli 20 kappaletta.

Nimiaineistot on poimittu huhtikuussa 2017.

Nimiaineistot ovat Microsoft Excel-tiedostomuodossa. Etunimien lukumäärät lajittelun mukaan on esitetty eri välilehdillä.

Resources (2)

Related Components (0) Add Related Component

Do you know apps based on this dataset? Add them by logging in.

Extra information

Period of validity
2017-04-06 -
Author
Esko Kirjalainen
Maintainer
Esko Kirjalainen
Owner
Väestörekisterikeskus
License
Creative Commons Attribution 4.0
Metadata created
2014-10-14T12:00:01.939669
Metadata modified
2017-05-02T14:42:35.047765
Isopen
True
URL
None
Valid from
2017-04-06
Private
False
Revision id
a65250ee-a340-4fc1-a09c-9183801a7670
Qa
[{'openness_score_reason': Markup(u'This file had not been downloaded at the time of scoring it. URL extension "xls" relates to format "XLS" and receives score: 2.')}, {'updated': Markup(u'2017-06-25T02:43:50.992384')}, {'openness_score': Markup(u'2')}]
Content type
Avoin data
Archiver
[{'status': Markup(u'System error during archival')}, {'is_broken': Markup(u'None')}, {'reason': Markup(u'No value for ckanext-archiver.cache_url_root in config')}, {'status_id': Markup(u'23')}]
Author email
esko.kirjalainen@vrk.fi
Creator user id
631f08fe-41e3-4c1f-99d4-4ee20ce5ba7b
Id
57282ad6-3ab1-48fb-983a-8aba5ff8d29a
Maintainer email
esko.kirjalainen@vrk.fi
Tracking summary
[{'total': Markup(u'3065')}, {'recent': Markup(u'563')}]

Comments

Nimiaineiston Power BI -visualisointi

Kiitos tästä aineistosta!

Laadin siitä visualisoinnin ilmaisella Power BI Desktop -välineellä:

https://hexcelligent.fi/2016/11/23/miten-suosittu-etu-tai-sukunimesi-on/

Olisi hienoa, jos aineistosta julkistettaisiin myös versio, missä olisi annettujen etunimien lukumäärät syntymävuosien perusteella.



Login to comment.
Open Data
avoin data
Feedback
Resource Quality
Metadata Quality

Väestötietojärjestelmän suomalaisten nimiaineistot

Followers
0
Last 30 days, updated daily
All time visits: 71064
All time downloads: 19842
Last Modified: 02.05.2017
Created: 14.10.2014

Show change log >