GEDCOM/CHAR-Tag: Unterschied zwischen den Versionen

Version vom 6. Dezember 2009, 17:44 Uhr

Info

Dieser Artikel hat noch wenig Substanz und ist eventuell nur mit einer Struktur oder mit minimalen Informationen angelegt worden, um die weitere Bearbeitung zu erleichtern. Falls jemand gesicherte Informationen ergänzen kann – nur zu!

Name und Bedeutung

Tag

CHAR

Formelle Bezeichnung

CHAR

Deutsche Bezeichnung

CHAR steht für Buchstabe.

Verwendung

Über das Tag CHAR soll die Kodierung der in der GEDCOM Datei benutzten Buchstaben und Zeichen festgelegt werden.

Formale Beschreibung zulässiger Werte

Basis

Basis dieser Beschreibung: GEDCOM Standard Draft 5.5.1

Der Standard erlaubt die Verwendung folgender Kodierungen:

- 8-Bit ANSEL

- ASCII (USA Version)

- UNICODE

- UTF-8

Standardfall

Jede GEDCOM Datei soll im Header Angaben zur benutzten Kodierung geben. Das Format ist wie folgt:

1 CHAR <Zeichensatzkodierung>

Beispiel:

1 CHAR UTF-8

! Achtung: Es sind nur folgende Kodierungen erlaubt.

<Zeichensatzkodierung> := ANSEL |UTF-8 | UNICODE | ASCII

Optionale Angaben

Versionsangabe

Zusätzlich zur Angabe der Kodierung kann weiterhin die Version des Kodierung angegeben werden, Beispiel:

1 CHAR ANSI
2 VERS 1252

Behandlung/Darstellung schwieriger Situationen

Folgende Themen sind derzeit in der GEDCOM-Arbeitsgruppe von Compgen mit den Programmentwicklern in Diskussion:

Standard Kodierung beim Export

Folgende GEDCOM 5.5.1 konforme Optionen stehen zur Zeit zur Diskussion:

UTF-8
- Erlaubt die unproblematische Darstellung von internationalen Zeichen
- Wird von einigen Programmen nicht unterstützt
ASCII
- Zu limitiert
ANSEL
- Gute Unterstützung von internationalen Zeichen
- Kaum benutzt und geringe Verbreitung
UTF-16
- Sehr gute Unterstützung von internationalen Zeichen
- Wird bis jetzt noch von sehr wenigen Programmen unterstützt

Bemerkung 1: Unter den Überbegriff UNICODE fallen alle UTF-n Kodierungen.
Bemerkung 2: ANSI ist zwar nicht GEDCOM 5.5.1 konform scheint aber heute noch von vielen Genealogieprogrammen als das Standardformat beim Import erwartet zu werden.

Status:

OFFEN

Mindestanforderung von Kodierungen beim Export

Die Frage kam auf ob und wenn welche Kodierungen ein Programm neben dem Standart Export noch unterstützen sollte.

UTF-8
UTF-16
ANSI (nicht GEDCOM 5.5.1 konform)
ASCII
ANSEL

Lösungsvorschlag:

Jedes Programm bietet als Standard-Export die Kodierung UTF-8
Als Option sollte mindestens einen Export mit Kodierung ANSI angeboten werde (die die meisten Programme heute als Standard haben)

Status:

OFFEN

Mindestanforderung von Kodierungen beim Import

Zu klären ist welche Kodierungen ein Programm bein Einlesen von Dateien mindestens unterstützen muß:

UTF-8
UNICODE
- UTF-16 Versionen
- UTF-32
- andere
ANSI
ASCII
ANSEL

Lösungsvorschlag:

Jedes Programm soll mindestens UTF-8 und ANSI beim Import verarbeiten können

Status:

OFFEN

Benutzung der Byte Order Mark (BOM) bei UNICODE Kodierungen

Folgende Optionen zur Unterstützung der BOM stehen offen:

BOM muß unterstützt werden.
BOM kann angegeben werden.
BOM darf nicht benutzt werden (Probleme bei älteren Programmen)

Status:

OFFEN

Versionsangaben bei UNICODE Kodierungen

Zu klären bleibt, ob eine Versionsangabe bei UNICODE nötig oder optional sein soll.

Status:

OFFEN

@@ Zeile 69: / Zeile 69: @@
 ** Kaum benutzt und geringe Verbreitung
 * UTF-16
-** Sehr gute unterstützung von internationalen Zeichen
+** Sehr gute Unterstützung von internationalen Zeichen
-** Wir bis jetzt noch von sehr wenigen Programmen unterstützt
+** Wird bis jetzt noch von sehr wenigen Programmen unterstützt
 Bemerkung 1: Unter den Überbegriff UNICODE fallen alle UTF-n Kodierungen.<br />

GEDCOM/CHAR-Tag: Unterschied zwischen den Versionen

Version vom 6. Dezember 2009, 17:44 Uhr

Inhaltsverzeichnis

Name und Bedeutung

Tag

Formelle Bezeichnung

Deutsche Bezeichnung

Verwendung

Formale Beschreibung zulässiger Werte

Basis

Standardfall

Optionale Angaben

Versionsangabe

Behandlung/Darstellung schwieriger Situationen

Standard Kodierung beim Export

Mindestanforderung von Kodierungen beim Export

Mindestanforderung von Kodierungen beim Import

Benutzung der Byte Order Mark (BOM) bei UNICODE Kodierungen

Versionsangaben bei UNICODE Kodierungen

Navigationsmenü

GEDCOM/CHAR-Tag: Unterschied zwischen den Versionen

Version vom 6. Dezember 2009, 17:44 Uhr

Name und Bedeutung

Tag

Formelle Bezeichnung

Deutsche Bezeichnung

Verwendung

Formale Beschreibung zulässiger Werte

Basis

Standardfall

Optionale Angaben

Versionsangabe

Behandlung/Darstellung schwieriger Situationen

Standard Kodierung beim Export

Mindestanforderung von Kodierungen beim Export

Mindestanforderung von Kodierungen beim Import

Benutzung der Byte Order Mark (BOM) bei UNICODE Kodierungen

Versionsangaben bei UNICODE Kodierungen

Navigationsmenü

Suche im GenWiki