Historisk befolkningsregister, HBR, er et register over den norske
befolkningen fra 1801 frem til Det sentrale folkeregisteret fra
1964. Det lages ved å lenke sammen personforekomster av samme person
i folketellinger og kirkebøker og koble sammen nære familiemedlemmer.
Vi viser hvordan algoritmer brukes til å finne lenker og
koblinger. Vi har funnet familierelasjoner i alle de nominative
folketellingene, også der familiestilling ikke er beskrevet i folketellingen.
Alle algoritmene baserer seg på likhet i navn, fødselsår, fødested,
yrke, bosted og tilsvarende egenskaper hos familiemedlemmer. I tillegg
sjekker vi at alle hendelsene gir et naturlig livsløp. Algoritmene
må tilpasses de ulike kildene for å holde feilraten under en teoretisk målsetning
på 1 % – noen fasit fins imidlertid ikke. Vi må for eksempel ha
strengere kriterier for likhet i store kommuner som Oslo, enn i
mindre kommuner og strengere i 1865-folketellingen enn i den mer
nøyaktige 1891-folketellingen. Vi har funnet samme person i etterfølgende
folketellinger på nasjonalt nivå ved å bruke sjeldne etternavn.
Vi har også søkt etter lignende personforekomster i samme kommune
og fylke i Digitalarkivet for alle personer i en av de nasjonale
folketellingene.
Det er laget maskinelle lenker ved Registeringssentral for
historiske data, UiT og Norsk Regnesentral. Ved nettstedet histreg.no
er det også mulig å lage manuelle lenker. Vi viser utviklingen av
bidragsytere, lenker og koblinger i databasen i den fireårige perioden
til registeret.
A population register enables us to follow persons and ancestries
over time. The Norwegian Historical Population Register follows
the Norwegian population from 1801 until the Central Population
Register takes over from 1964. It is created by linking together
records about the same person in censuses and church books, making
family relations explicit.
We explain how to use computer algorithms in order to find
links and family relations. We have found family relations in all
the nominative censuses, also in the censuses where the family position
is not registered. The record linkage algorithms are based on similarities
in names, birth year, birthplace, occupation, address and relations
with family members. In addition, we also check that the events
make up a probable life course. The algorithms must be adapted to
the characteristics of each source in order to keep the error rates
low. For example, it is necessary to require stronger similarities
for large municipalities such as Oslo, than in smaller municipalities.
Computer algorithms for record linkage and the encoding of
family relations have been created both at the UiT – Arctic University
of Norway and the Norwegian Computing Center. At the internet site
histreg.no, developed by the Norwegian Computing Center and maintained
by the National Archives, genealogists may see the current links
and family relations and manually create new ones or change the
existing ones.