GEDCOM/HEAD-Tag: Unterschied zwischen den Versionen

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen
Zeile 91: Zeile 91:
== Behandlung/Darstellung schwieriger Situationen ==
== Behandlung/Darstellung schwieriger Situationen ==
=== Diskussionsstand in der Arbeitsgruppe der Programmautoren ===
=== Diskussionsstand in der Arbeitsgruppe der Programmautoren ===
'''Gedcom-L Kennung'''
In 2019 wurde die Diskussion für HEAD vor allem mit dem Schwerpunkt wieder aufgenommen, wie im HEAD der Bezug auf unsere Vereinbarungen in der Gedcom-L untergebracht werden kann. Verfolgt werden damit zwei Ziele:
- Verweis auf unsere Vereinbarungen mit dem Ziel, den Inhalt insbesondere zu den Nutzerdefinierten Erweiterungen allgemein bereitzustellen
- Erhöhung des Bekanntheitsgrades der Vereinbarungen, Ausweitung auf weitere Programme und Einbringung der Ergebnisse in die Diskussionen um zukünftige Standards zum Datenaustausch zwischen Genealogieprogrammen.
Unterstützt werden sollen diese Ziele durch die Veröffentlichung einer (englischsprachigen) Zusammenfassung unserer Vereinbarungen, insbesondere zum Umgang mit Widersprüchen im Standard 5.5.1 sowie zu der gemeinsamen Einführung Nutzerdefinierter Kennzeichen.
Schwerpunkt der Diskussion um die Kennzeichnung ist die Betrachtung der Kennzeichen GEDC.VERS und DEST im HEAD-Datensatz. Vorschläge dazu sind z.B.
<source lang="gedcom">
1 GEDC
2 VERS 5.5.1 Gedcom-L
1 GEDC
2 VERS 5.5.1
3 _EXTENDED Gedcom-L
1 DEST 5.5.1 extended by Gedcom-L
</source>
Betrachtet wird derzeit, ob die vorgeschlagenen Varianten beim Import in Drittprogramme Probleme bereiten könnten. Wenn z.B.
<source lang="gedcom">
2 VERS 5.5.1 Gedcom-L
</source>
dazu führt, dass einige Programme den Import abbrechen, weil sie einen Standard "5.5.1 Gedcom-L" nicht kennen, dann ist das eine nicht gewollte Beeinträchtigung des Datentransfers. Genau so ist zu klären, ob es Programme gibt, die DEST interpretieren und da bestimmte Inhalte erwarten (der ursprüngliche Einsatz für AncestralFile ist entfallen, daneben sieht der Standard nur für Tempelverordnungen der Mormonen einen genau vorgegebenen Inhalt vor).
In der Diskussion wurde dann herausgearbeitet, dass neben dem Hinweis auf die Gedcom-L auch ein Link im Internet auf die Zusammenfassung unserer Vereinbarungen eingesetzt werden soll. Im Querverweis auf die Aktivitäten der FHISO in Richtung eines neuen Standards wurde eingebracht, dass dort zu jedem verwendeten Kennzeichen ein Internetlink mit der Definition dieses Kennzeichens eingeführt werden soll. Ein Link auf unsere Zusammenfassung der Vereinbarungen wäre ein erster Schritt in diese Richtung. Das Vorgehen wäre mit unseren Vereinbarungen zu _SCHEMA abzugleichen.
=== Abweichungen vom Standard bei der Verwendung ===
=== Abweichungen vom Standard bei der Verwendung ===
<!-- Sortierfolge auf der Kategorienseite gemäß letzten Teil des Titelpfades -> also dem Tagnamen -->
<!-- Sortierfolge auf der Kategorienseite gemäß letzten Teil des Titelpfades -> also dem Tagnamen -->

Version vom 18. November 2019, 07:23 Uhr

Name und Bedeutung

Tag

HEAD

Formelle Bezeichnung

HEADER

Deutsche Bezeichnung

Vorspann

Verwendung

Im Vorspann (Dateikopf) werden die für die gesamte Datei geltenden allgemeinen Aussagen und Festlegungen getroffen.

Formale Beschreibung zulässiger Werte

Aussagen des GEDCOM-Standards

Mit HEAD werden die allgemeingültigen Aussagen und Randbedingungen zur ganzen GEDCOM-Datei dargestellt. Im GEDCOM-Standard ist seine Struktur so beschrieben:

HEADER:=
n HEAD {1:1}
+1 SOUR <APPROVED_SYSTEM_ID> {1:1}
+2 VERS <VERSION_NUMBER> {0:1}
+2 NAME <NAME_OF_PRODUCT> {0:1}
+2 CORP <NAME_OF_BUSINESS> {0:1}
+3 <<ADDRESS_STRUCTURE>> {0:1}
+2 DATA <NAME_OF_SOURCE_DATA> {0:1}
+3 DATE <PUBLICATION_DATE> {0:1}
+3 COPR <COPYRIGHT_SOURCE_DATA> {0:1}
+4 [CONT|CONC]<COPYRIGHT_SOURCE_DATA> {0:M}
+1 DEST <RECEIVING_SYSTEM_NAME> * {0:1}
+1 DATE <TRANSMISSION_DATE> {0:1}
+2 TIME <TIME_VALUE> {0:1}
+1 SUBM @<XREF:SUBM>@ {1:1}
+1 SUBN @<XREF:SUBN>@ {0:1}
+1 FILE <FILE_NAME> {0:1}
+1 COPR <COPYRIGHT_GEDCOM_FILE> {0:1}
+1 GEDC {1:1}
+2 VERS <VERSION_NUMBER> {1:1}
+2 FORM <GEDCOM_FORM> {1:1}
+1 CHAR <CHARACTER_SET> {1:1}
+2 VERS <VERSION_NUMBER> {0:1}
+1 LANG <LANGUAGE_OF_TEXT> {0:1}
+1 PLAC {0:1}
+2 FORM <PLACE_HIERARCHY> {1:1}
+1 NOTE <GEDCOM_CONTENT_DESCRIPTION> {0:1}
+2 [CONC|CONT] <GEDCOM_CONTENT_DESCRIPTION> {0:M}

Der Name des Quellsystems (SOUR) identifiziert dabei, welches System die Daten gesendet hat. Der Name des Zielsystems (DEST) identifiziert dabei, an welches System die Datei ursprünglich übermittelt werden sollte. Das lesende Programm findet die GEDCOM-Version (GEDC.VERS) und die Form (GEDC.FORM). Die Angabe des Zeichensatzes (CHAR) ist zwingend.

Der Datensatz zu HEAD wird einmal in die GEDCOM-Datei eingestellt, er steht immer zu Beginn der Datei als erster Datensatz. Vor der Zeile

  • 0 HEAD

darf außer ggfs einem BOM (welches die Zeichenkodierung steuern kann) nichts anderes stehen.

Zu beachten ist, dass die Kennzeichen im Datensatz HEAD zum Teil anders definiert sind und andere Unterstrukturen haben als in anderen Datensätzen. SOUR ist hier z.B. nur als eingebettete Version zulässig und hat eine Unterstruktur, die von der bei Aufruf in anderen Datensätzen abweicht. Auch NOTE kann nur eingebettet verwendet werden, und hat nur eine sehr eingeschränkte Unterstruktur.

Bereits an anderer Stelle sind behandelt: CHAR und SUBM. Weitere Vereinbarungen zum HEADer sind getroffen unter: PLAC (Vorgaben zu FORM) und unter Nutzerdefinierte Kennzeichen (Beschreibung mit _SCHEMA).

Vereinbarungen zum HEAD-Datensatz

Für folgende Kennzeichen wurden eigene Vereinbarungen getroffen, die hier nicht nochmals behandelt werden: CHAR (inkl. BOM zu Beginn der Datei), SUBM, PLAC.FORM, _SCHEMA.

Die folgenden Vereinbarungen H1 bis H6 wurden durch Abstimmung unter den in der Gedcom-L mitarbeitenden Programmautoren entschieden:

H1 Angaben zum erzeugenden Programm

Im Header jeder GEDCOM-Datei müssen Angaben zum Programm gemacht werden, mit welchem diese Datei erzeugt wurde. Die Angaben erfolgen unter SOUR sowie den SOUR untergeordneten Kennzeichen. Die im Standard eigentlich vorgesehene GEDCOM-Registrierung der Programme exitiert nicht. Unter HEAD.SOUR wird daher eine vom Programmautor gewählte, von der aktuellen Programmversion unabhängige Kennung für das Programm exportiert. Diese Kennung sollte möglichst eindeutig das Programm identifizieren. Die Kennung darf keine Leerzeichen enthalten. Eine Trennung von Bestandteilen der Kennung kann statt über Leerzeichen durch den Unterstrich _ erfolgen. Es wird empfohlen, eine maximal 20 Zeichen lange Kennung zu wählen. Die weiteren Kennzeichen unter SOUR sind optional und enthalten die Version des Programmes (SOUR.VERS), den vollständigen Namen des Programmes (SOUR.NAME), den Programmhersteller (SOUR.CORP) sowie dessen Adressangaben in der Adress-Struktur.

H2 Angaben zur Quelle und zum Urheberrecht

Unter SOUR.DATA können Informationen zur Quelle ausgegeben werden, die bei der Erzeugung der Datei ausgewertet wurde. SOUR.DATA darf jedoch maximal einmal ausgegeben werden. Dabei können unter SOUR.DATA.COPR auch Angaben zum Urheberrecht / Copyright der Quelle gemacht werden. Unter HEAD.COPR können Angaben zum Urheberrecht bzw. Copyright zu der Datei eingestellt werden, auch dieses Kennzeichen darf nur maximal einmal ausgegeben werden.

H3 Datum

Das Datum, an dem die Datei erstellt wird, kann unter dem Kennzeichen DATE ausgegeben werden. Dabei muss die im Standard vorgeschriebene Form für exakte Datumsangaben ( Tag Monat Jahr im Format DD MMM JJJJ ) eingehalten werden. Diesem kann die Uhrzeit mit dem Kennzeichen DATE.TIME im Format hh:mm:ss.fs ( Stunden 24h-Format : Minuten : optional Sekunden : optional Nachkommastellen der Sekunden ) zugefügt werden.

H4 HEAD.DEST - das Zielsystem

Unter HEAD.DEST können Angaben zum Zielsystem gemacht werden. Empfohlen wird das insbesondere dann, wenn ein Sonderexport für bestimmte Zwecke gemacht wird (abweichend vom Standardexport).

H5 GEDCOM Version

Laut GEDCOM-Standard muss die GEDCOM-Version angegeben werden. Für alle Exporte, die dem Standard 5.5.1 folgen, muss im HEADER folgende Sequenz enthalten sein:

1 GEDC
2 VERS 5.5.1
2 FORM LINEAGE-LINKED

H6 Bemerkungen zur Datei

Unter HEAD.NOTE können Bemerkungen zur Datei exportiert werden. Außer den Fortsetzungszeilen CONC/CONT sind keine Unterstrukturen zulässig.

Behandlung/Darstellung schwieriger Situationen

Diskussionsstand in der Arbeitsgruppe der Programmautoren

Gedcom-L Kennung

In 2019 wurde die Diskussion für HEAD vor allem mit dem Schwerpunkt wieder aufgenommen, wie im HEAD der Bezug auf unsere Vereinbarungen in der Gedcom-L untergebracht werden kann. Verfolgt werden damit zwei Ziele: - Verweis auf unsere Vereinbarungen mit dem Ziel, den Inhalt insbesondere zu den Nutzerdefinierten Erweiterungen allgemein bereitzustellen - Erhöhung des Bekanntheitsgrades der Vereinbarungen, Ausweitung auf weitere Programme und Einbringung der Ergebnisse in die Diskussionen um zukünftige Standards zum Datenaustausch zwischen Genealogieprogrammen. Unterstützt werden sollen diese Ziele durch die Veröffentlichung einer (englischsprachigen) Zusammenfassung unserer Vereinbarungen, insbesondere zum Umgang mit Widersprüchen im Standard 5.5.1 sowie zu der gemeinsamen Einführung Nutzerdefinierter Kennzeichen.

Schwerpunkt der Diskussion um die Kennzeichnung ist die Betrachtung der Kennzeichen GEDC.VERS und DEST im HEAD-Datensatz. Vorschläge dazu sind z.B.

1 GEDC 
2 VERS 5.5.1 Gedcom-L

1 GEDC 
2 VERS 5.5.1
3 _EXTENDED Gedcom-L

1 DEST 5.5.1 extended by Gedcom-L

Betrachtet wird derzeit, ob die vorgeschlagenen Varianten beim Import in Drittprogramme Probleme bereiten könnten. Wenn z.B.

2 VERS 5.5.1 Gedcom-L

dazu führt, dass einige Programme den Import abbrechen, weil sie einen Standard "5.5.1 Gedcom-L" nicht kennen, dann ist das eine nicht gewollte Beeinträchtigung des Datentransfers. Genau so ist zu klären, ob es Programme gibt, die DEST interpretieren und da bestimmte Inhalte erwarten (der ursprüngliche Einsatz für AncestralFile ist entfallen, daneben sieht der Standard nur für Tempelverordnungen der Mormonen einen genau vorgegebenen Inhalt vor).

In der Diskussion wurde dann herausgearbeitet, dass neben dem Hinweis auf die Gedcom-L auch ein Link im Internet auf die Zusammenfassung unserer Vereinbarungen eingesetzt werden soll. Im Querverweis auf die Aktivitäten der FHISO in Richtung eines neuen Standards wurde eingebracht, dass dort zu jedem verwendeten Kennzeichen ein Internetlink mit der Definition dieses Kennzeichens eingeführt werden soll. Ein Link auf unsere Zusammenfassung der Vereinbarungen wäre ein erster Schritt in diese Richtung. Das Vorgehen wäre mit unseren Vereinbarungen zu _SCHEMA abzugleichen.

Abweichungen vom Standard bei der Verwendung

en:GEDCOM/HEAD-Tag