Pilot-Projekt: Indtastning af lægdsruller
Beskrivelse af indtastninger
Navngivning af indtastninger
Navngivningen af indtastningerne har meget tilfælles med billedernes navngivning.
En indtastnings filnavn er opbygget sådan her:
YYYAaaaLRXMM.csv,
f.eks
792HolbLRX01.csv.
Betydningen af filnavnets segmenter er (eksemplets segmenter er vist i parentes):
YYY (792): Lægdsrullens årstal - 1000.
Aaaa (Holb): En versal efterfulgt af små bogstaver, som entydigt identificerer amtet.
LR (LR): Altid LR, hvilket identificerer indtastningen som en lægdsrulle.
X (X): Versal, som bruges til at skelne mellem flere lægdsruller, som dækker samme lægd i samme år. 'R' tænkes anvendt for lægdsruller som (i original) findes på Rigsarkivet. 'L' tænkes anvendt for ditto på et landsarkiv, mens 'X' er for en ekstrasession, som findes (i original) på et landsarkiv.
MM (01): Lægdets nummer angivet med 2 cifre.
.csv (.csv): Angivelse af filens format, CSV.
Format af indtastninger
Indtastninger er CSV-filer, hvor hvert felts værdi står i "er og er adskilt med ';'.
Indtastningens første række indeholder felternes navne.
For første hovedrulle er de:
LøbeNo.: Rullens fortløbende nummer. En rulle kan indeholde flere indførsler med samme løbenummer, i så fald er alle pånær det sidste af de gentagne numre normalt overstreget i rullen.
Mandskabers Navne.
Huusfædres Navne.
Fødested.
Alder. AAr.
Størrelse. Tommer.
Opholdssted.
Anmærkninger.
For efterfølgende hovedruller er feltet 'LøbeNo.' erstattet med feltet 'Nye Løbe No.', og feltet 'Gamle Løbe No.' er tilføjet.
Derudover findes følgende felter:
Reference til næste rulle.: Hvis 'Anmærkninger' indeholder en reference til en anden rulle, så skrives denne reference også her. Ideen er at det skal være nemt at maskinelt følge manden frem gennem årene, også ved flytninger
Samme Fadernavn: Indførsler er ofte fælles om en 'Huusfaders navn'. I så fald skrives een af 'næste', 'forrige' og 'forrige og næste'. Dette kan tolkes som at indførslerne drejer sig om brødre.
Indtasters Bemærkninger: Bemærkninger som indtasteren måtte have.
Selve indtastningen
Indtastningen er (forsøgt) foretaget præcis som skrevet i originalen,
med undtagelse af hvad der vedrører den nedenfor nævnte brug af '=='.
Selve indtastningen er sket i en tabulator-separeret fil (i en almindelig tekst-editor).
Denne tabulator-separerede fil er herefter omdannet til en .csv-fil.
Tabulator-separerede filer er ikke tiltænkt fri cirkulation, men snarere som et mellemprodukt, der skal lette selve indtastningen.
En indtaster kan således indsende tabulator-separerede filer til projektets administrator, som herefter sørger for
omdannelsen til en CSV-fil.
Følgende meta-tegn er anvendt:
<>, som omslutter tekst, der er overstreget. Et overstreget løbenummer 25 angives f.eks. som <25>. Anvendes <>'er ifbm. personnavne skal hele navnet omsluttes, f.eks <..am L..r>, således at <>'erne får mindre effekt på en eventuel fritekstsøgning.
[], som betyder udeladt, typisk pga. ulæselighed. []'er kan omslutte en delvist eller usikkert læst tekst.
. (punktum) kan imellem []'er anvendes til angive indtasterens formodning om antallet af ulæste bogstaver, f.eks. formodes
ordet i [Bi..ne] at være på 6 bogstaver. Anvendes []'er ifbm. personnavne skal hele navnet omsluttes,
f.eks [..am L..r], således at []'erne får mindre effekt på en eventuel fritekstsøgning.
{}, tænkes anvendt til at omslutte tekst indskudt af indtasteren. Er endnu ikke anvendt.
I den tabulator-separerede fil kan et helt felts tekst derudover være erstattet af meta-tegnet:
==, som betyder at teksten i feltet er tegn eller ord, der betyder at den faktiske tekst er den samme den i det
foregående felt.
F.eks. bør variationer af 'ibidem' under føde- og opholdssted indtastes som ==. En lang streg under fødested
indtastes også som ==. == anvendes på samme måde, når en indførsel deler 'Huusfaders navn' med den
foregående indførsel. == erstattes i .csv-filen af teksten i feltet ovenfor, således at == ikke forekommer i CSV-filen.
Når der i den tabulator-separedede fil under 'Huusfaders navn' står == får det betydning for teksten i ekstra-feltet
'Samme Fadernavn'. Den foregående indførsel får under 'Samme Fadernavn' teksten 'næste'. Hvis der er flere på
hinanden følgende indførsler med == under 'Huusfaders navn', så får alle pånær den sidste teksten 'forrige og næste'
under 'Samme Fadernavn', mens den sidste får teksten 'forrige'. Ideen er at det skal være nemmere at maskinelt finde
formodede brødre. Brug af == betyder at ord, som 'ibidem' i originalen, i CSV-filen er erstattet af det stednavn,
der hentydes til.
Til forsiden
Lars Kr. Lundin
Last modified: Tue Aug 19 13:40:09 CEST 2003