Sådan finder GEDCOMP de identiske personer
Sammenligning via slægtninge
Når 2 personer sammenlignes, bruges ikke kun deres egne navne og datoer, men også navne og datoer fra deres forældre, søskende, ægtefæller og børn. Dette gøres rekursivt, således at også bedsteforældre, svigerfamilie, fætre, kusiner, børnebørn osv. indgår i vurderingen. Som udgangspunkt bruges de nærmeste slægtninge og deres nærmeste slægtninge i vurderingen, men dette kan ændres efter behov. Den store fordel ved dette er, at en person i en GEDCOM-fil næsten altid har noget familie, således at der som oftest er et godt sammenligningsgrundlag.Forskellige personnavne
For at tage hensyn til forskellig stavemåde af personnavne, konverteres alle personnavne til en slags fonetisk stavning, dvs. stavemåden ændres til noget, der minder om den måde navnet udtales på. En person kan ændre efternavn, og i nogle sammenhænge undlade at bruge/opgive et eller flere fornavne. GEDCOMP vil derfor sammenligne 2 personer, hvis de bare har et enkelt fornavn til fælles.Stednavne
GEDCOMP sammenligner også stednavne i søgningen efter identiske personer. Når GEDCOMP sammenligner to stednavne, så anvendes sammenligningens resultat forskelligt alt efter hvilke typer af stednavne, der er tale om:- Hvis de to stednavne begge beskriver det samme sogn tildeles et antal plus-points.
- Hvis de to stednavne er forskellige, og det ene stednavn geografisk set er indeholdt i det andet tildeles ingen points (f.eks. Nors og Thisted amt).
- Hvis de to stednavne er forskellige og hvis de geografisk set ikke overlapper hinanden, tildeles et antal minus-points (f.eks. Norge og Thisted amt).
- Hvis de to stednavne er ens, men ikke beskriver et sogn, tildeles pt. ingen points.
Med GEDCOM angives et sted som et (kommasepareret) hierarki af stednavne. I Danmark består dette hierarki (før kommunalreformen i 1970) af:
et sogn, sognets herred, herredets amt, Danmark; f.eks.
Torsted sogn, Hind herred, Ringkøbing amt, Danmark
Andre eksempler på gode angivelser af stednavne er:
- Torsted, Hind, Ringkøbing
- Lövestad, Skåne, Sverige
- Cambiano, Torino, Italien
GEDCOMP vil i langt de fleste tilfælde være i stand til at forstå stedsangivelser, som ikke (helt) følger GEDCOM-standarden. Stednavne som de følgende er derfor væsentligt bedre end ingenting:
- Torsted
- Torsted pr. Thisted
- København
- Utah
- Det nordlige Italien
GEDCOMP genkender pt. over 50.000 danske og udenlandske stednavne, som de bl.a. er stavet i:
- ISO-3166-1 (Engelsk og dansk)
- ISO-3166-2 (Engelsk)
- Autoriserede stednavne i Danmark
- DIS-Danmarks "Særnummer 98 - Sogn, Herred, Amt"
- Danmarks Stifter
- Sogne i Danmarks folketælling år 1801
- Län, kommuner och församlingar i Sverige
- Fylkeskommuner og kommuner i Norge
- Local Administrative Units (LAU) i Sverige
- Local Administrative Units (LAU) i Tyskland
- Local Administrative Units (LAU) i Østrig
- Local Administrative Units (LAU) i Italien
GEDCOMPs stednavnedatabase er konstrueret så den nemt kan udvides med flere stednavne. Derfor må det forventes at ovenstående liste vokser med tiden.
Manglende datoer
Den logiske kontrol af datoerne, der er beskrevet ovenfor, bruges også til at sætte grænser for hvornår en person er født og død. Dette gøres rekursivt, således at fødselsdagen for en given person (løseligt) kan estimeres udfra f.ex. en fætters fødselsdag. Dette reducerer antallet af forkerte bud på personsammenfald betragteligt.Dette eksempel på et resultat af en GEDCOMP-sammenligning viser med stor tydelighed hvorledes GEDCOMP kan identificere personsammenfald på trods af uoverenstemmelser mellem navne og datoer. De to filer indeholder 1870 henholdsvis 4437 personer.