GEDCOM/OBJE-Tag: Unterschied zwischen den Versionen

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen
(neu angelegt)
 
Zeile 54: Zeile 54:
== Behandlung/Darstellung schwieriger Situationen ==
== Behandlung/Darstellung schwieriger Situationen ==
=== Diskussionsstand in der Arbeitsgruppe der Programmautoren ===
=== Diskussionsstand in der Arbeitsgruppe der Programmautoren ===
=== Änderungen gegenüber GEDCOM 5.5 ===
Im GEDCOM Standard 5.5 ist eine deutliche Änderung gegenüber dem Vorgänger 5.5 enthalten: Die Möglichkeit, komplette Multimediadateien mit dem Kennzeichen BLOB direkt in die GEDCOM-Datei einzubetten, wurde in 5.5.1 entfernt. Die Gedcom-L hat dies sehr intensiv diskutiert und ist zu folgenden Ergebnissen gekommen:
1. In 5.5 ist diese Einbettung nicht ausreichend beschrieben. Da der Verschlüsselungstyp für die Binärdatei nicht mit angegeben wird, wird es für das empfangende Programm schwierig, die Binärdaten zu entschlüsseln.
2. Es ist kein einziges Programm bekannt, welche diese Möglichkeit mit BLOB umgesetzt hat. Alle Genealogieprogramme, die überhaupt Multimedia-Dateien unterstützen, arbeiten mit Dateinamen ( OBJE.FILE ), ggfs inklusive Pfadangaben.
3. Bis auf einen Autor haben sich alle anderen Autoren und Anwender in der Diskussion dafür ausgesprochen, dem Standard 5.5.1 zu folgen und keine Einbettung von Binärdateien in GEDCOM-Dateien zu vereinbaren. Hauptbegründung ist neben der generellen Basis GEDCOM 5.5.1 in diesem Projekt die mangelhafte Kompatibilität einer solchen Vorgehensweise und damit drohender Datenverlust.
Enstprechend diesem Diskussionsstand sind die Entscheidungsvorschläge aufgebaut.
Zu dem neu eingeführten Kennzeichen FORM unter OBJE.FILE siehe unten (bei Dateitypen).
=== Pfadangaben ===
In der Diskussion wurde herausgearbeitet, dass die Anforderung des Standards zur MULTIMEDIA_FILE_REFERENCE ( OBJE.FILE ):
"Eine komplette Referenz auf eine lokale oder entfernte Datei, auf die im GEDCOM-Kontext verwiesen wird."
wie folgt zu interpretieren ist:
Die Referenz muss insofern komplett sein, als sie die Lokalisierung der Datei erlauben muss. Dazu ist es nicht notwendig und auch nicht geeignet, den kompletten Pfad einschließlich der Laufwerksbezeichnung zu übertragen, da diese Angaben nach einem Transfer auf einen anderen Rechner meist nicht mehr passen. Stattdessen wird ein relativer Pfad vorgesehen, um die Multimediadatei relativ zum aktuellen Verzeichnis der GEDCOM-Datei zu lokalisieren.
Ergänzend wurde vorgeschlagen, im Header den Dateinamen der GEDCOM-Datei mit dem kompletten Pfad zu exportieren, um die genaue Lokalisierung auf dem sendenden Rechner zu beschreiben.
=== Länge des Feldes Dateireferenz ===
Im GEDCOM-Standard wird zur Referenzangabe auf eine Multimediadatei folgende Angabe zur Länge gemacht:
MULTIMEDIA_FILE_REFERENCE:= {Size=1:30}
Eine Beschränkung auf 30 Zeichen könnte kritisch werden, wenn neben dem Dateinamen wie diskutiert auch Pfadangaben in diesem Feld mit aufgenommen werden. Daher verweist die Diskussion hier darauf, dass die Längenangaben zu Datenfeldern ( hier 30 Zeichen ) Mindestangaben sind. Es dürfen (und sollten hier) auch mehr Zeichen als 30 unterstützt werden, um die Pfad- und DAteinamen vollständig zu übertragen.
=== Dateitypen ===
Mit GEDCOM 5.5.1 ist auch das Kennzeichen FORM unter OBJE.FILE als zwingend vorgeschriebenes Kennzeichen eingeführt worden. In der Gedcom-L wurde diskutiert, dass die dazu im GEDCOM Standard enthaltene Auswahl der möglichen Dateitypen (Dateiendungen) nicht als abschließend, sondern nur als Auflistung von Beispielen interpretiert wird:
"MULTIMEDIA_FORMAT:= [ bmp | gif | jpg | ole | pcx | tif | wav ]"
In dieser Auflistung fehlen so wesentliche Dateiendungen wie mp3, pdf und doc. Solche Dateien sollen ebnefalls referenziert werden können.
=== Medientypen ===
Es wurde festgestellt, dass der GEDCOM Standard 5.5.1 mit seiner Definition der Medientypen nicht dem MIME-Standard folgt.
Der GEDCOM-Standard hat das Kennzeichen MEDIA (welches ab 5.5.1 dem vorgeschriebenen OBJE.FILE.FORM optional unterstellt wird) wie folgt beschreiben:
"SOURCE_MEDIA_TYPE:= [ audio | book | card | electronic | fiche | film | magazine | manuscript | map | newspaper | photo | tombstone | video ]"
Während audio und video z.B. im MIME Standard auch aufgeführt sind, gilt das nicht für die meisten anderen im GEDCOM-Standard genannten Medientypen. Dagegen fehlen solche Medientypen aus dem MIME-Standard wie text, image, message im GEDCOM-Standard.
Die Diskussion zu diesem Thema ist nicht abgeschlossen.
=== Ausschnitte aus Grafikdateien ===
Von einigen Programmen wurde vorgetragen, dass sie intern die Möglichkeit haben, aus vorhandenen Grafikdateien nur bestimmte Ausschnitte anzuzeigen. Die Information, welche Ausschnitte das jeweils sind, sollen auch nach GEDCOM exportiert werden. Ein Vorschlag dazu ist (in Anlehnung an den Family Tree Builder):
<source lang="GEDCOM">
1 OBJE
2 FILE ./Bild.jpg
3 FORM jpg
4 MEDI fiche
2 TITL Max Muster
2 _PRIM_CUTOUT Y
2 _POSITION 879 602 1559 1509
</source>
Mit _PRIM_CUTOUT Y wird die Information übertragen, dass an dieser Stelle nur ein Ausschnitt der Datei referenziert wird, mit _POSITION dazu die Festlegung dieses Ausschnittes.
Offen ist noch die genaue Festlegung, was die 4 Zahlen hinter _POSITION beschreiben sollen. Es könnte sein:
X-Position, Y-Position (beides von der linken oberen Ecke), Breite, Höhe. Es könnte aber auch sein:
X-Position, Y-Position (beides von der linken oberen Ecke), X-Position, Y-Position (beides von der rechten unteren Ecke)
=== Abweichungen vom Standard bei der Verwendung ===
=== Abweichungen vom Standard bei der Verwendung ===
<!-- Sortierfolge auf der Kategorienseite gemäß letzten Teil des Titelpfades -> also dem Tagnamen -->
<!-- Sortierfolge auf der Kategorienseite gemäß letzten Teil des Titelpfades -> also dem Tagnamen -->

Version vom 16. November 2011, 10:24 Uhr

Name und Bedeutung

Tag

OBJE

Formelle Bezeichnung

OBJECT

Deutsche Bezeichnung

Verweis auf Daten

Verwendung

Normalerweise Verweis auf Bild-, Audio-, Video-Daten, z.B. Fotos, Dokumenten-Scans: "Multimedia-Link"

Formale Beschreibung zulässiger Werte

Vorgaben des GEDCOM Standards

Verweise auf meist in Dateien angelegte, zu einem Datensatz gehörende Bild-, Audio- oder Videodaten werden über das Kennzeichen OBJE dargestellt. Wie bei Quellen und Bemerkungen gibt es im GEDCOM-Standard zwei verschiedene Vorgehensweisen zu OBJE:

  • eingebettete Darstellung: OBJE ist mit allen untergeordneten Kennzeichen direkt im aufrufenden Datensatz enthalten
  • eigener Datensatz: OBJE verweist mit einem Zeiger auf einen Datensatz, in dem die entsprechenden Informationen enthalten sind

Dies wird im GEDCOM-Standard 5.5.1 so dargestellt:

MULTIMEDIA_LINK:=
[
n OBJE @<XREF:OBJE>@ {1:1}
|
n OBJE
+1 FILE <MULTIMEDIA_FILE_REFN> {1:M}
+2 FORM <MULTIMEDIA_FORMAT> {1:1}
+3 MEDI <SOURCE_MEDIA_TYPE> {0:1}
+1 TITL <DESCRIPTIVE_TITLE> {0:1}
]

Dabei ist die Zeile mit +2 FORM bei GEDCOM 5.5.1 neu gegenüber GEDCOM 5.5 eingefügt. MEDI hat entsprechend eine um 1 höhere Ebenennummer erhalten.

Der Multimedia-Datensatz sieht nach GEDCOM-Standard-Vorgabe so aus:

MULTIMEDIA_RECORD:=
n @XREF:OBJE@ OBJE {1:1}
+1 FILE <MULTIMEDIA_FILE_REFN> {1:M}
+2 FORM <MULTIMEDIA_FORMAT> {1:1}
+3 TYPE <SOURCE_MEDIA_TYPE> {0:1}
+2 TITL <DESCRIPTIVE_TITLE> {0:1}
+1 REFN <USER_REFERENCE_NUMBER> {0:M}
+2 TYPE <USER_REFERENCE_TYPE> {0:1}
+1 RIN <AUTOMATED_RECORD_ID> {0:1}
+1 <<NOTE_STRUCTURE>> {0:M}
+1 <<SOURCE_CITATION>> {0:M}
+1 <<CHANGE_DATE>> {0:1}

Wie schon bei SOUR und NOTE sind im eigenen Datensatz für OBJE mehr strukturelle Möglichkeiten zur Darstellung von Detailinformationen gegeben als in der eingebetteten Version. Auffällig ist die Verwendung unterschiedlicher Kennzeichen für den <SOURCE_MEDIA_TYPE> in der eingebetteten Version ( MEDI ) gegenüber der Datensatz-Version ( TYPE ). Das ist wohl dem noch unausgereiften Stand des GEDCOM 5.5.1 geschuldet.

Behandlung/Darstellung schwieriger Situationen

Diskussionsstand in der Arbeitsgruppe der Programmautoren

Änderungen gegenüber GEDCOM 5.5

Im GEDCOM Standard 5.5 ist eine deutliche Änderung gegenüber dem Vorgänger 5.5 enthalten: Die Möglichkeit, komplette Multimediadateien mit dem Kennzeichen BLOB direkt in die GEDCOM-Datei einzubetten, wurde in 5.5.1 entfernt. Die Gedcom-L hat dies sehr intensiv diskutiert und ist zu folgenden Ergebnissen gekommen:

1. In 5.5 ist diese Einbettung nicht ausreichend beschrieben. Da der Verschlüsselungstyp für die Binärdatei nicht mit angegeben wird, wird es für das empfangende Programm schwierig, die Binärdaten zu entschlüsseln.

2. Es ist kein einziges Programm bekannt, welche diese Möglichkeit mit BLOB umgesetzt hat. Alle Genealogieprogramme, die überhaupt Multimedia-Dateien unterstützen, arbeiten mit Dateinamen ( OBJE.FILE ), ggfs inklusive Pfadangaben.

3. Bis auf einen Autor haben sich alle anderen Autoren und Anwender in der Diskussion dafür ausgesprochen, dem Standard 5.5.1 zu folgen und keine Einbettung von Binärdateien in GEDCOM-Dateien zu vereinbaren. Hauptbegründung ist neben der generellen Basis GEDCOM 5.5.1 in diesem Projekt die mangelhafte Kompatibilität einer solchen Vorgehensweise und damit drohender Datenverlust.

Enstprechend diesem Diskussionsstand sind die Entscheidungsvorschläge aufgebaut.

Zu dem neu eingeführten Kennzeichen FORM unter OBJE.FILE siehe unten (bei Dateitypen).

Pfadangaben

In der Diskussion wurde herausgearbeitet, dass die Anforderung des Standards zur MULTIMEDIA_FILE_REFERENCE ( OBJE.FILE ):

"Eine komplette Referenz auf eine lokale oder entfernte Datei, auf die im GEDCOM-Kontext verwiesen wird."

wie folgt zu interpretieren ist: Die Referenz muss insofern komplett sein, als sie die Lokalisierung der Datei erlauben muss. Dazu ist es nicht notwendig und auch nicht geeignet, den kompletten Pfad einschließlich der Laufwerksbezeichnung zu übertragen, da diese Angaben nach einem Transfer auf einen anderen Rechner meist nicht mehr passen. Stattdessen wird ein relativer Pfad vorgesehen, um die Multimediadatei relativ zum aktuellen Verzeichnis der GEDCOM-Datei zu lokalisieren.

Ergänzend wurde vorgeschlagen, im Header den Dateinamen der GEDCOM-Datei mit dem kompletten Pfad zu exportieren, um die genaue Lokalisierung auf dem sendenden Rechner zu beschreiben.

Länge des Feldes Dateireferenz

Im GEDCOM-Standard wird zur Referenzangabe auf eine Multimediadatei folgende Angabe zur Länge gemacht:

MULTIMEDIA_FILE_REFERENCE:= {Size=1:30}

Eine Beschränkung auf 30 Zeichen könnte kritisch werden, wenn neben dem Dateinamen wie diskutiert auch Pfadangaben in diesem Feld mit aufgenommen werden. Daher verweist die Diskussion hier darauf, dass die Längenangaben zu Datenfeldern ( hier 30 Zeichen ) Mindestangaben sind. Es dürfen (und sollten hier) auch mehr Zeichen als 30 unterstützt werden, um die Pfad- und DAteinamen vollständig zu übertragen.

Dateitypen

Mit GEDCOM 5.5.1 ist auch das Kennzeichen FORM unter OBJE.FILE als zwingend vorgeschriebenes Kennzeichen eingeführt worden. In der Gedcom-L wurde diskutiert, dass die dazu im GEDCOM Standard enthaltene Auswahl der möglichen Dateitypen (Dateiendungen) nicht als abschließend, sondern nur als Auflistung von Beispielen interpretiert wird:

"MULTIMEDIA_FORMAT:= [ bmp | gif | jpg | ole | pcx | tif | wav ]"

In dieser Auflistung fehlen so wesentliche Dateiendungen wie mp3, pdf und doc. Solche Dateien sollen ebnefalls referenziert werden können.

Medientypen

Es wurde festgestellt, dass der GEDCOM Standard 5.5.1 mit seiner Definition der Medientypen nicht dem MIME-Standard folgt. Der GEDCOM-Standard hat das Kennzeichen MEDIA (welches ab 5.5.1 dem vorgeschriebenen OBJE.FILE.FORM optional unterstellt wird) wie folgt beschreiben: "SOURCE_MEDIA_TYPE:= [ audio | book | card | electronic | fiche | film | magazine | manuscript | map | newspaper | photo | tombstone | video ]"

Während audio und video z.B. im MIME Standard auch aufgeführt sind, gilt das nicht für die meisten anderen im GEDCOM-Standard genannten Medientypen. Dagegen fehlen solche Medientypen aus dem MIME-Standard wie text, image, message im GEDCOM-Standard.

Die Diskussion zu diesem Thema ist nicht abgeschlossen.

Ausschnitte aus Grafikdateien

Von einigen Programmen wurde vorgetragen, dass sie intern die Möglichkeit haben, aus vorhandenen Grafikdateien nur bestimmte Ausschnitte anzuzeigen. Die Information, welche Ausschnitte das jeweils sind, sollen auch nach GEDCOM exportiert werden. Ein Vorschlag dazu ist (in Anlehnung an den Family Tree Builder):

1 OBJE
2 FILE ./Bild.jpg
3 FORM jpg
4 MEDI fiche
2 TITL Max Muster
2 _PRIM_CUTOUT Y
2 _POSITION 879 602 1559 1509

Mit _PRIM_CUTOUT Y wird die Information übertragen, dass an dieser Stelle nur ein Ausschnitt der Datei referenziert wird, mit _POSITION dazu die Festlegung dieses Ausschnittes.

Offen ist noch die genaue Festlegung, was die 4 Zahlen hinter _POSITION beschreiben sollen. Es könnte sein: X-Position, Y-Position (beides von der linken oberen Ecke), Breite, Höhe. Es könnte aber auch sein: X-Position, Y-Position (beides von der linken oberen Ecke), X-Position, Y-Position (beides von der rechten unteren Ecke)

Abweichungen vom Standard bei der Verwendung

en:GEDCOM/OBJE-Tag