GEDCOM/SOUR-Tag

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
< GEDCOM
Version vom 25. Mai 2010, 09:41 Uhr von AEmmerich (Diskussion • Beiträge) (Priorität für Quell-Datensätze bearbeitet)
Zur Navigation springen Zur Suche springen

Name und Bedeutung

Tag

SOUR

Formelle Bezeichnung

SOURCE

Deutsche Bezeichnung

Quelle

Verwendung

Ursprungsmaterial, von dem Informationen herausgezogen wurde

Formale Beschreibung zulässiger Werte

Aussagen des GEDCOM Standards 5.5.1 zu SOUR

zitiert aus der Übersetzung von Jörn Daub


SOUR im Header der GEDCOM-Datei

Die HEADER Struktur bildet den Dateikopf, und beinhaltet Informationen über die gesamte Übertragung. Der Name des Quellsystems (SOUR) identifiziert dabei, welches System die Daten gesendet hat.

  • n HEAD {1:1}
  • +1 SOUR <APPROVED_SYSTEM_ID> {1:1}
  • +2 VERS <VERSION_NUMBER> {0:1}
  • +2 NAME <NAME_OF_PRODUCT> {0:1}
  • +2 CORP <NAME_OF_BUSINESS> {0:1}
  • +3 <<ADDRESS_STRUCTURE>> {0:1}
  • +2 DATA <NAME_OF_SOURCE_DATA> {0:1}
  • +3 DATE <PUBLICATION_DATE> {0:1}
  • +3 COPR <COPYRIGHT_SOURCE_DATA> {0:1}
  • +4 [CONT|CONC]<COPYRIGHT_SOURCE_DATA> {0:M}

mit

APPROVED_SYSTEM_ID:= {Size=1:20} (anerkannte System Identifikation) Ein System-identifizierender Name, der durch den GEDCOM-Registrierungsprozess vergeben wurde. Dieser Name muss eindeutig das Produkt von anderen unterscheiden. Leerzeichen innerhalb des Namens müssen durch 0x5F (Unterstrich _) ersetzt werden, so dass ein Wort gebildet wird.

VERSION_NUMBER:= {Size=1:15} (Versionsnummer) Eine Identifikation der Versionsnummer des zugehörigen Produktes. Sie wird vom Hersteller des Produktes zugewiesen und geändert.

NAME_OF_PRODUCT:= {Size=1:90} (Name des Produktes) Der Name des Softwareproduktes, das die Datei (Übermittlung) erstellt hat.

NAME_OF_BUSINESS:= {Size=1:90} (Name des Unternehmens), Name des Unternehmens, der Firma oder der Personen, die das Produkt hergestellt oder kommissioniert hat.

NAME_OF_SOURCE_DATA:= {Size=1:90} (Name der Quelldaten) Der Name der elektronischen Datenquelle, die benutzt wurde, um die Daten in der Datei zu erhalten. Beispielsweise könnten diese von einer CD-Rom stammen, die mit "Volkszählung der USA von 1880 CD-ROM Band 13" bezeichnet war.

PUBLICATION_DATE:= {Size=10:11} <DATE_EXACT> (Veröffentlichungsdatum) Das Datum, an dem diese Quelle veröffentlicht oder erzeugt wurde.

COPYRIGHT_SOURCE_DATA:= {Size=1:90} (Vervielfältigungsrecht, Quelldaten) Eine Aussage, die vom Eigentümer der Daten verlangt wird, von dem die Daten erhalten (oder heruntergeladen) wurden. Beispiel: Wenn eine GEDCOM-Datei von Ancestral File heruntergeladen wird, würde dies als Inhaber des Vervielfältigungsrechtes angegeben, um anzuzeigen, dass die Daten von einer rechtlich geschützten Quelle stammen

Die Address-Struktur wird in einem eigenen Artikel dargestellt. Die angegebenen Feldlängen ( Size=... ) sind vom GEDCOM-Standard empfohlene Mindestlängen für Datenbanken mit längenbegrenzten Feldern.

Wo wird SOUR verwendet?

Neben der Verwendung von SOUR im Header ( mit eigener Struktur in diesem Kontext ) wird SOUR als SOURCE_CITATION an vielen Stellen in der GEDCOM-Struktur verwendet. Der GEDCOM-Standard nennt:

  • FAM_RECORD
  • INDIVIDUAL_RECORD
  • MULTIMEDIE_RECORD
  • NOTE_RECORD
  • ASSOCIATION_STRUCTURE
  • EVENT_DETAIL
  • LDS_INDIVIDUAL_ORDINANCE ( d.h. BAPL, CONL, ENDL, SGLC )
  • LDS_SPOUSE_SEALING ( d.h. SGLS )
  • PERSONAL_NAME_PIECES

Quellzitat-Struktur ( SOURCE_CITATION )

SOURCE_CITATION:=

  • [ /* Zeiger auf einen Quell-Datensatz (bevorzugt) */
  • n SOUR @<XREF:SOUR>@ {1:1}
  • +1 PAGE <WHERE_WITHIN_SOURCE> {0:1}
  • +1 EVEN <EVENT_TYPE_CITED_FROM> {0:1}
  • +2 ROLE <ROLE_IN_EVENT> {0:1}
  • +1 DATA {0:1}
  • +2 DATE <ENTRY_RECORDING_DATE> {0:1}
  • +2 TEXT <TEXT_FROM_SOURCE> {0:M}
  • +3 [CONC|CONT] <TEXT_FROM_SOURCE> {0:M}
  • +1 <<MULTIMEDIA_LINK>> {0:M}
  • +1 <<NOTE_STRUCTURE>> {0:M}
  • +1 QUAY <CERTAINTY_ASSESSMENT> {0:1}
  • | /* Für Systeme, die keine Quell-Datensätze nutzen */
  • n SOUR <SOURCE_DESCRIPTION> {1:1}
  • +1 [CONC|CONT] <SOURCE_DESCRIPTION> {0:M}
  • +1 TEXT <TEXT_FROM_SOURCE> {0:M}
  • +2 [CONC|CONT] <TEXT_FROM_SOURCE> {0:M}
  • +1 <<MULTIMEDIA_LINK>> {0:M}
  • +1 <<NOTE_STRUCTURE>> {0:M}
  • +1 QUAY <CERTAINTY_ASSESSMENT> {0:1}
  • ]

Die Daten in der Quellzitat-Struktur (SOURCE_CITATION) beinhaltet Informationen zu der Quelle im Bezug auf die zitierten Daten. (Siehe GEDCOM Beispiele). Systeme, die keine Quell-Datensätze (SOURCE_RECORD, Systeme mit Quell-Datensätzen bezeichnen diese oft auch als Master-Quellen oder Haupt-Quellen) nutzen, müssen die nicht bevorzugte zweite Variante der Quellzitat-Struktur nutzen. Systeme, die Quell-Datensätze der Ebene null nutzen, müssen dann, wenn sie ein Quellzitat entdecken, das keinen Zeiger auf einen Quell-Datensatz enthält selbständig einen neuen Quell-Datensatz anlegen, und die Beschreibung (SOURCE_DESCRIPTION) des Quellzitates in dessen Titel speichern. Die Quellzitat-Struktur ist zum Speichern (u.A.) folgender Informationen gedacht:

  • Ein Zeiger auf den Quell-Datensatz (SOURCE_RECORD), der eine allgemeinere Beschreibung der zitierten Quelle beinhaltet.
  • Informationen, wie z. B. eine Seitennummer, die dem Anwender beim Auffinden der zitierten Daten innerhalb der referenzierten Quelle zu helfen. Diese wird im „.SOUR.PAGE“ Kontext gespeichert.
  • Eine Abschrift desjenigen Textes der Quelle, der für Annahmen und Schlussfolgerungen genutzt wurde, beispielsweise eine Datumsangabe, wie sie sich tatsächlich in der Quelle findet, oder wichtige Notizen durch den Schreibenden, oder ein zutreffender Satz aus einem Brief. Dies wird im „.SOUR.DATA.TEXT“ Kontext gespeichert.
  • Daten, welche Schlussfolgerungen erlauben, einer Quelle den Vorzug vor einer anderen zu geben (Primärquelle, Sekundärquelle, etc.). Zu dessen Ermittlung werden verschiedene Informationen benötigt: Die Zeitspanne zwischen dem Datum des Ereignisses und dessen Aufzeichnung in einer bestimmten Quelle, welche Art von Ereignis zitiert wurde, und welche Rolle diese Person in der zitierten Quelle einnahm.
    • Das Datum, an dem der Eintrag in dem Quelldokument aufgezeichnet wurde, wird im „.SOUR.DATA.DATE“ Kontext gespeichert.
    • Die Art des Ereignisses, welches die Aufzeichnung auslöste, wird im „.SOUR.EVEN“ Kontext gespeichert. Der Wert ist einer möglichen Werte aus <EVENT_TYPE_CITED_FROM>
    • Die Rolle dieser Person in dem Ereignis wird im „.SOUR.EVEN.ROLE“ Kontext gespeichert.


Quell-Datensätze ( SOURCE_RECORD )

SOURCE_RECORD:=

  • n @<XREF:SOUR>@ SOUR {1:1}
  • +1 DATA {0:1}
  • +2 EVEN <EVENTS_RECORDED> {0:M}
  • +3 DATE <DATE_PERIOD> {0:1}
  • +3 PLAC <SOURCE_JURISDICTION_PLACE> {0:1}
  • +2 AGNC <RESPONSIBLE_AGENCY> {0:1}
  • +2 <<NOTE_STRUCTURE>> {0:M}
  • +1 AUTH <SOURCE_ORIGINATOR> {0:1}
  • +2 [CONC|CONT] <SOURCE_ORIGINATOR> {0:M}
  • +1 TITL <SOURCE_DESCRIPTIVE_TITLE> {0:1}
  • +2 [CONC|CONT] <SOURCE_DESCRIPTIVE_TITLE> {0:M}
  • +1 ABBR <SOURCE_FILED_BY_ENTRY> {0:1}
  • +1 PUBL <SOURCE_PUBLICATION_FACTS> {0:1}
  • +2 [CONC|CONT] <SOURCE_PUBLICATION_FACTS> {0:M}
  • +1 TEXT <TEXT_FROM_SOURCE> {0:1}
  • +2 [CONC|CONT] <TEXT_FROM_SOURCE> {0:M}
  • +1 <<SOURCE_REPOSITORY_CITATION>> {0:M}
  • +1 REFN <USER_REFERENCE_NUMBER> {0:M}
  • +2 TYPE <USER_REFERENCE_TYPE> {0:1}
  • +1 RIN <AUTOMATED_RECORD_ID> {0:1}
  • +1 <<CHANGE_DATE>> {0:1}
  • +1 <<NOTE_STRUCTURE>> {0:M}
  • +1 <<MULTIMEDIA_LINK>> {0:M}

Quell-Datensätze werden benutzt, um eine bibliografische Beschreibung der zitierten Quelle zu liefern. (Siehe auch: <<SOURCE_CITATION>>-Unterstruktur, die einen Zeiger auf den Quell-Datensatz enthält.)


Priorität für Quell-Datensätze

Der GEDCOM-Standard macht an mehreren Stellen sehr deutlich, dass statt der einfachen, eingebetteten Quellenzitate die Struktur der Quell-Datensätze ( SOURCE_RECORDS ) verwendet werden soll. Eine zentrale Stelle hierfür ist die Beschreibung der Quell-Zitate ( SOURCE_CITATION, s. dort ), wo die Quell-Datensätze ( SOURCE_RECORD ) als bevorzugte Darstellung für Quellen im GEDCOM ausgewiesen sind. Dennoch sind die einfachen Quellzitate ( s. SOURCE_CITATION ) auch zugelassen.

Weitere wörtliche Zitate aus dem GEDCOM-Standard 5.5.1:

STRUKTUR DER QUELLEN

GEDCOM 5.x Draft Produkte werden ermuntert, ihre Programme so schnell wie möglich auf The GEDCOM Standard 5.5 zu aktualisieren.

ÄNDERUNGEN, DIE MIT 5.4 DRAFT EINGEFÜHRT ODER MODIFIZIERT WURDEN.

  • Der Quelldatensatz (siehe <SOURCE_RECORD>) wurde in fünf Bereiche vereinfacht: Daten oder Klassifikation, Autor, Titel, Veröffentlichungsdaten und Quellarchiv. Die Daten oder Klassifikationssektion beinhaltet Fakten über die Daten, die in dieser Quelle enthalten sind, und werden benutzt, um die Sammlung an Quellen zu analysieren, die der Forscher genutzt hat. Die Sektionen Autor, Titel, Veröffentlichungsdaten und Quellarchiv enthalten freie Textblöcke, die spätere Forscher davon informieren, wie sie die Quelldaten erhalten können, die der ursprüngliche Forscher genutzt hat.
  • Eine <SOURCE_CITATION> Struktur wurde unterhalb des zitierten Fakts eingefügt. Es ist normalerweise das Beste, wenn das Quellzitat nur die Information enthält, die spezifisch für das zitierte Fakt sind und dann auf die generelle Beschreibung der Quelle zeigt, wie sie in <SOURCE_RECORD> beschrieben ist. Dies reduziert die Redundanz, bietet einen Weg, die Größe eines Datensatzes zu begrenzen, und ist dichter an einem normalisierten Datenmodell.
  • Systeme, die Quellen über AUTH, TITL, PUBL und REPO-Felder beschreiben können und sollten immer diese Information in GEDCOM in dem Quelldatensatz (<SOURCE_RECORD>) übertragen, auf den aus der <SOURCE_CITATION> verwiesen wird. Systeme, die nur freie Quellnotizen erlauben, sollten dazu ermuntern dass diese Informationen über die folgenden Kategorien enthalten:
    • TITL – ein beschreibender Titel der Quelle
    • AUTH – Wer hat das Werk erschaffen
    • PUBL - Wann und wo wurde es erschaffen
    • REPO – wo kann man es erhalten

Wenn möglich sollten die Kennzeichen für diese Kategorien im Text angegeben werden, so dass ein empfangendes System diese wieder parsen, und sie so den empfohlenen Feldern der Quell- oder Zitatstruktur zuordnen kann.


Behandlung/Darstellung schwieriger Situationen

Abweichungen vom Standard bei der Verwendung