GEDCOM/OBJE-Tag: Unterschied zwischen den Versionen

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen
(→‎Ausschnitte aus Grafikdateien: Struktur für _POSITION und _PRIM_CUTOUT geändert)
(→‎Formale Beschreibung zulässiger Werte: Entscheidungsvorschläge aufgenommen ( O4 vorläufig ))
Zeile 51: Zeile 51:
Wie schon bei SOUR und NOTE sind im eigenen Datensatz für OBJE mehr strukturelle Möglichkeiten zur Darstellung von Detailinformationen gegeben als in der eingebetteten Version.
Wie schon bei SOUR und NOTE sind im eigenen Datensatz für OBJE mehr strukturelle Möglichkeiten zur Darstellung von Detailinformationen gegeben als in der eingebetteten Version.
Auffällig ist die Verwendung unterschiedlicher Kennzeichen für den <SOURCE_MEDIA_TYPE> in der eingebetteten Version ( MEDI ) gegenüber der Datensatz-Version ( TYPE ). Das ist wohl dem noch unausgereiften Stand des GEDCOM 5.5.1 geschuldet.
Auffällig ist die Verwendung unterschiedlicher Kennzeichen für den <SOURCE_MEDIA_TYPE> in der eingebetteten Version ( MEDI ) gegenüber der Datensatz-Version ( TYPE ). Das ist wohl dem noch unausgereiften Stand des GEDCOM 5.5.1 geschuldet.
== Entscheidungsvorschläge für Vereinbarungen zu OBJE ==
Auf der Basis der Diskussion in der Gedcom-L wurden die folgenden Entscheidungsvorschläge entwickelt. Sie sind derzeit noch in Feinabstimmung, bevor über sie durch eine Abstimmung der an der Liste beteiligten Programmautoren abgestimmt wird.
=== O1 Umfang zu Multimediadateien ===
Es wird vereinbart, den Export zu Multimediadateien entsprechend der Vorgaben des GEDCOM Standards 5.5.1 durchzuführen. Insbesondere müssen die Änderungen gegenüber dem GEDCOM-Standard 5.5 umgesetzt werden: Einführung des vorgeschriebenen Kennzeichens FORM unter OBJE.FILE, Entfall eingebetteter Binärdateien ( BLOB ). Die Referenzierung mehrerer Multimediadateien ( OBJE.FILE(n) ) in einem Multimediadatensatz ist wie im Standard vorgesehen zulässig.
=== O2 Referenzierung auf Multimediadateien ===
Auf Multimediadateien wird durch die Angabe von Pfadinformationen und Dateinamen verwiesen ( in OBJE.FILE ). Zu diesen Verweisen wird vereinbart:
*- die Dateiendung (Dateityp) darf mit dem Dateinamen zusammen angegeben werden. Dies wird auch empfohlen, um die Kompatibiltät zu Programmen herzustellen, die das mit 5.5.1 eingeführte FORM - Kennzeichen nicht interpretieren können.
*- als Pfadinformationen wird entweder der vollständige Pfad auf einen Ort in einem Netzwerk oder im Internet angegeben oder der relative Pfad zur Datei im exportierenden System. Im letzteren Fall ist das Verzeichnis, in dem die GEDCOM-Datei steht, als Basisverzeichnis zu wählen. Dieses Basisverzeichnis wird im Header durch Angabe des absoluten Pfades im exportierenden System zusammen mit dem Namen der GEDCOM-Datei bekannt gemacht.
*- es wird empfohlen, mehr als die im Standard vorgeschriebene Mindestlänge von 30 Zeichen für das Datenfeld OBJE.FILE umzusetzen, um auch längere Dateinamen inkl. der vorgenannten Pfainformationen aufnehmen zu können.
*- die Dateieindung muss zusätzlich in einem dem FILE Kennzeichen untergeordneten Kennzeichen FORM exportiert werden.
=== O3 Zulässige Dateitypen ===
Es ist erlaubt, beliebige Dateien als Multimediadateien zu referenzieren. Die im GEDCOM-Standard enthaltene Aufzählung von Dateitypen unter MULTIMEDIA_FORMAT wird als nicht abschließende Liste von Beispielen interpretiert.
=== O4 Ausschnitte aus Bilddateien ===
Es ist zulässig, Informationen zu Ausschnitten aus referenzierten Bilddateien zu exportieren. Um diese Information zu exportieren, wird die Verwendung der Nutzerdefinierten Kennzeichen _PRIM_CUTOUT und _POSITION vereinbart. Diese Kennzeichen werden dem Kennzeichen FILE untergeordnet:
<source lang="GEDCOM">
2 FILE ./Dateiname.Dateityp
3 FORM Dateityp
3 _PRIM_CUTOUT Y
3 _POSITION x1 y1 x2 y2
Mit _PRIM_OUT Y wird angegeben, dass in diesem Fall aus der Datei der unter _POSITION genannte Ausschnitt verwendet werden soll. Die genaue Bedeutung der Zahlenwerte x1,y1,x2,y2 ist derzeit noch in Abstimmung


== Behandlung/Darstellung schwieriger Situationen ==
== Behandlung/Darstellung schwieriger Situationen ==

Version vom 16. November 2011, 11:04 Uhr

Name und Bedeutung

Tag

OBJE

Formelle Bezeichnung

OBJECT

Deutsche Bezeichnung

Verweis auf Daten

Verwendung

Normalerweise Verweis auf Bild-, Audio-, Video-Daten, z.B. Fotos, Dokumenten-Scans: "Multimedia-Link"

Formale Beschreibung zulässiger Werte

Vorgaben des GEDCOM Standards

Verweise auf meist in Dateien angelegte, zu einem Datensatz gehörende Bild-, Audio- oder Videodaten werden über das Kennzeichen OBJE dargestellt. Wie bei Quellen und Bemerkungen gibt es im GEDCOM-Standard zwei verschiedene Vorgehensweisen zu OBJE:

  • eingebettete Darstellung: OBJE ist mit allen untergeordneten Kennzeichen direkt im aufrufenden Datensatz enthalten
  • eigener Datensatz: OBJE verweist mit einem Zeiger auf einen Datensatz, in dem die entsprechenden Informationen enthalten sind

Dies wird im GEDCOM-Standard 5.5.1 so dargestellt:

MULTIMEDIA_LINK:=
[
n OBJE @<XREF:OBJE>@ {1:1}
|
n OBJE
+1 FILE <MULTIMEDIA_FILE_REFN> {1:M}
+2 FORM <MULTIMEDIA_FORMAT> {1:1}
+3 MEDI <SOURCE_MEDIA_TYPE> {0:1}
+1 TITL <DESCRIPTIVE_TITLE> {0:1}
]

Dabei ist die Zeile mit +2 FORM bei GEDCOM 5.5.1 neu gegenüber GEDCOM 5.5 eingefügt. MEDI hat entsprechend eine um 1 höhere Ebenennummer erhalten.

Der Multimedia-Datensatz sieht nach GEDCOM-Standard-Vorgabe so aus:

MULTIMEDIA_RECORD:=
n @XREF:OBJE@ OBJE {1:1}
+1 FILE <MULTIMEDIA_FILE_REFN> {1:M}
+2 FORM <MULTIMEDIA_FORMAT> {1:1}
+3 TYPE <SOURCE_MEDIA_TYPE> {0:1}
+2 TITL <DESCRIPTIVE_TITLE> {0:1}
+1 REFN <USER_REFERENCE_NUMBER> {0:M}
+2 TYPE <USER_REFERENCE_TYPE> {0:1}
+1 RIN <AUTOMATED_RECORD_ID> {0:1}
+1 <<NOTE_STRUCTURE>> {0:M}
+1 <<SOURCE_CITATION>> {0:M}
+1 <<CHANGE_DATE>> {0:1}

Wie schon bei SOUR und NOTE sind im eigenen Datensatz für OBJE mehr strukturelle Möglichkeiten zur Darstellung von Detailinformationen gegeben als in der eingebetteten Version. Auffällig ist die Verwendung unterschiedlicher Kennzeichen für den <SOURCE_MEDIA_TYPE> in der eingebetteten Version ( MEDI ) gegenüber der Datensatz-Version ( TYPE ). Das ist wohl dem noch unausgereiften Stand des GEDCOM 5.5.1 geschuldet.

Entscheidungsvorschläge für Vereinbarungen zu OBJE

Auf der Basis der Diskussion in der Gedcom-L wurden die folgenden Entscheidungsvorschläge entwickelt. Sie sind derzeit noch in Feinabstimmung, bevor über sie durch eine Abstimmung der an der Liste beteiligten Programmautoren abgestimmt wird.

O1 Umfang zu Multimediadateien

Es wird vereinbart, den Export zu Multimediadateien entsprechend der Vorgaben des GEDCOM Standards 5.5.1 durchzuführen. Insbesondere müssen die Änderungen gegenüber dem GEDCOM-Standard 5.5 umgesetzt werden: Einführung des vorgeschriebenen Kennzeichens FORM unter OBJE.FILE, Entfall eingebetteter Binärdateien ( BLOB ). Die Referenzierung mehrerer Multimediadateien ( OBJE.FILE(n) ) in einem Multimediadatensatz ist wie im Standard vorgesehen zulässig.

O2 Referenzierung auf Multimediadateien

Auf Multimediadateien wird durch die Angabe von Pfadinformationen und Dateinamen verwiesen ( in OBJE.FILE ). Zu diesen Verweisen wird vereinbart:

  • - die Dateiendung (Dateityp) darf mit dem Dateinamen zusammen angegeben werden. Dies wird auch empfohlen, um die Kompatibiltät zu Programmen herzustellen, die das mit 5.5.1 eingeführte FORM - Kennzeichen nicht interpretieren können.
  • - als Pfadinformationen wird entweder der vollständige Pfad auf einen Ort in einem Netzwerk oder im Internet angegeben oder der relative Pfad zur Datei im exportierenden System. Im letzteren Fall ist das Verzeichnis, in dem die GEDCOM-Datei steht, als Basisverzeichnis zu wählen. Dieses Basisverzeichnis wird im Header durch Angabe des absoluten Pfades im exportierenden System zusammen mit dem Namen der GEDCOM-Datei bekannt gemacht.
  • - es wird empfohlen, mehr als die im Standard vorgeschriebene Mindestlänge von 30 Zeichen für das Datenfeld OBJE.FILE umzusetzen, um auch längere Dateinamen inkl. der vorgenannten Pfainformationen aufnehmen zu können.
  • - die Dateieindung muss zusätzlich in einem dem FILE Kennzeichen untergeordneten Kennzeichen FORM exportiert werden.

O3 Zulässige Dateitypen

Es ist erlaubt, beliebige Dateien als Multimediadateien zu referenzieren. Die im GEDCOM-Standard enthaltene Aufzählung von Dateitypen unter MULTIMEDIA_FORMAT wird als nicht abschließende Liste von Beispielen interpretiert.

O4 Ausschnitte aus Bilddateien

Es ist zulässig, Informationen zu Ausschnitten aus referenzierten Bilddateien zu exportieren. Um diese Information zu exportieren, wird die Verwendung der Nutzerdefinierten Kennzeichen _PRIM_CUTOUT und _POSITION vereinbart. Diese Kennzeichen werden dem Kennzeichen FILE untergeordnet:

2 FILE ./Dateiname.Dateityp
3 FORM Dateityp
3 _PRIM_CUTOUT Y
3 _POSITION x1 y1 x2 y2

Mit _PRIM_OUT Y wird angegeben, dass in diesem Fall aus der Datei der unter _POSITION genannte Ausschnitt verwendet werden soll. Die genaue Bedeutung der Zahlenwerte x1,y1,x2,y2 ist derzeit noch in Abstimmung

== Behandlung/Darstellung schwieriger Situationen ==
=== Diskussionsstand in der Arbeitsgruppe der Programmautoren ===

=== Änderungen gegenüber GEDCOM 5.5 ===

Im GEDCOM Standard 5.5 ist eine deutliche Änderung gegenüber dem Vorgänger 5.5 enthalten: Die Möglichkeit, komplette Multimediadateien mit dem Kennzeichen BLOB direkt in die GEDCOM-Datei einzubetten, wurde in 5.5.1 entfernt. Die Gedcom-L hat dies sehr intensiv diskutiert und ist zu folgenden Ergebnissen gekommen:

1. In 5.5 ist diese Einbettung nicht ausreichend beschrieben. Da der Verschlüsselungstyp für die Binärdatei nicht mit angegeben wird, wird es für das empfangende Programm schwierig, die Binärdaten zu entschlüsseln.

2. Es ist kein einziges Programm bekannt, welche diese Möglichkeit mit BLOB umgesetzt hat. Alle Genealogieprogramme, die überhaupt Multimedia-Dateien unterstützen, arbeiten mit Dateinamen ( OBJE.FILE ), ggfs inklusive Pfadangaben.

3. Bis auf einen Autor haben sich alle anderen Autoren und Anwender in der Diskussion dafür ausgesprochen, dem Standard 5.5.1 zu folgen und keine Einbettung von Binärdateien in GEDCOM-Dateien zu vereinbaren. Hauptbegründung ist neben der generellen Basis GEDCOM 5.5.1 in diesem Projekt die mangelhafte Kompatibilität einer solchen Vorgehensweise und damit drohender Datenverlust.

Enstprechend diesem Diskussionsstand sind die Entscheidungsvorschläge aufgebaut.

Zu dem neu eingeführten Kennzeichen FORM unter OBJE.FILE siehe unten (bei Dateitypen).

=== Pfadangaben ===

In der Diskussion wurde herausgearbeitet, dass die Anforderung des Standards zur MULTIMEDIA_FILE_REFERENCE ( OBJE.FILE ):

"Eine komplette Referenz auf eine lokale oder entfernte Datei, auf die im GEDCOM-Kontext verwiesen wird."

wie folgt zu interpretieren ist:
Die Referenz muss insofern komplett sein, als sie die Lokalisierung der Datei erlauben muss. Dazu ist es nicht notwendig und auch nicht geeignet, den kompletten Pfad einschließlich der Laufwerksbezeichnung zu übertragen, da diese Angaben nach einem Transfer auf einen anderen Rechner meist nicht mehr passen. Stattdessen wird ein relativer Pfad vorgesehen, um die Multimediadatei relativ zum aktuellen Verzeichnis der GEDCOM-Datei zu lokalisieren.

Ergänzend wurde vorgeschlagen, im Header den Dateinamen der GEDCOM-Datei mit dem kompletten Pfad zu exportieren, um die genaue Lokalisierung in dem sendenden System zu beschreiben.

=== Länge des Feldes Dateireferenz ===

Im GEDCOM-Standard wird zur Referenzangabe auf eine Multimediadatei folgende Angabe zur Länge gemacht:

MULTIMEDIA_FILE_REFERENCE:= {Size=1:30}

Eine Beschränkung auf 30 Zeichen könnte kritisch werden, wenn neben dem Dateinamen wie diskutiert auch Pfadangaben in diesem Feld mit aufgenommen werden. Daher verweist die Diskussion hier darauf, dass die Längenangaben zu Datenfeldern ( hier 30 Zeichen ) Mindestangaben sind. Es dürfen (und sollten hier) auch mehr Zeichen als 30 unterstützt werden, um die Pfad- und DAteinamen vollständig zu übertragen.

=== Dateitypen ===

Mit GEDCOM 5.5.1 ist auch das Kennzeichen FORM unter OBJE.FILE als zwingend vorgeschriebenes Kennzeichen eingeführt worden. In der Gedcom-L wurde diskutiert, dass die dazu im GEDCOM Standard enthaltene Auswahl der möglichen Dateitypen (Dateiendungen) nicht als abschließend, sondern nur als Auflistung von Beispielen interpretiert wird:

"MULTIMEDIA_FORMAT:= [ bmp | gif | jpg | ole | pcx | tif | wav ]"

In dieser Auflistung fehlen so wesentliche Dateiendungen wie mp3, pdf und doc. Solche Dateien sollen ebenfalls referenziert werden können.

=== Medientypen ===

Es wurde festgestellt, dass der GEDCOM Standard 5.5.1 mit seiner Definition der Medientypen nicht dem MIME-Standard folgt.
Der GEDCOM-Standard hat das Kennzeichen MEDIA (welches ab 5.5.1 dem vorgeschriebenen OBJE.FILE.FORM optional unterstellt wird) wie folgt beschreiben:
"SOURCE_MEDIA_TYPE:= [ audio | book | card | electronic | fiche | film | magazine | manuscript | map | newspaper | photo | tombstone | video ]"

Während audio und video z.B. im MIME Standard auch aufgeführt sind, gilt das nicht für die meisten anderen im GEDCOM-Standard genannten Medientypen. Dagegen fehlen solche Medientypen aus dem MIME-Standard wie text, image, message im GEDCOM-Standard.

Die Diskussion zu diesem Thema ist nicht abgeschlossen.

=== Ausschnitte aus Grafikdateien ===

Von einigen Programmen wurde vorgetragen, dass sie intern die Möglichkeit haben, aus vorhandenen Grafikdateien nur bestimmte Ausschnitte anzuzeigen. Die Information, welche Ausschnitte das jeweils sind, sollen auch nach GEDCOM exportiert werden. Ein Vorschlag dazu ist (in Anlehnung an den Family Tree Builder):
<source lang="GEDCOM">
1 OBJE
2 FILE ./Bild.jpg
3 FORM jpg
3 _PRIM_CUTOUT Y
3 _POSITION 879 602 1559 1509
4 MEDI fiche
2 TITL Max Muster

Mit _PRIM_CUTOUT Y wird die Information übertragen, dass an dieser Stelle nur ein Ausschnitt der Datei referenziert wird, mit _POSITION dazu die Festlegung dieses Ausschnittes.

Offen ist noch die genaue Festlegung, was die 4 Zahlen hinter _POSITION beschreiben sollen. Es könnte sein: X-Position, Y-Position (beides von der linken oberen Ecke), Breite, Höhe. Es könnte aber auch sein: X-Position, Y-Position (beides von der linken oberen Ecke), X-Position, Y-Position (beides von der rechten unteren Ecke)

Abweichungen vom Standard bei der Verwendung

en:GEDCOM/OBJE-Tag