GEDCOM/CHAR-Tag: Unterschied zwischen den Versionen
K (→Versionsangabe) |
|||
Zeile 54: | Zeile 54: | ||
== Behandlung/Darstellung schwieriger Situationen == | == Behandlung/Darstellung schwieriger Situationen == | ||
Folgende Themen sind derzeit in der GEDCOM-Arbeitsgruppe von Compgen mit den Programmentwicklern in Diskussion: | |||
=== Standard Kodierung beim Export === | |||
Folgende GEDCOM 5.5.1 konforme Optionen stehen zur Zeit zur Diskussion: | |||
* UTF-8 | |||
** erlaubt die unproblematische Darstellung von internationalen Zeichen | |||
** wird von einigen Programmen nicht unterstützt | |||
* ANSI | |||
** Wird von den meisten Programmen, auch älteren Programmen problemlos eingelesen | |||
** Ein nur eingeschränkter Zeichensatz wird unterstützt | |||
* ASCII | |||
** Zu limitiert | |||
* ANSEL | |||
** Gute unterstützung von internationalen Zeichen | |||
** Kaum benutzt und geringe Verbreitung | |||
* UTF-16 | |||
** Sehr gute unterstützung von internationalen Zeichen | |||
** Wir bis jetzt noch von sehr wenigen Programmen unterstützt | |||
Bemerkung: Unter den Überbegriff UNICODE fallen alle UTF-n Kodierungen. | |||
Status: | |||
''OFFEN'' | |||
=== Mindestanforderung von Kodierungen beim Export === | |||
Die Frage kam auf ob und wenn welche Kodierungen ein Programm neben dem Standart Export noch unterstützen sollte. | |||
* UTF-8 | |||
* UTF-16 | |||
* ANSI | |||
* ASCII | |||
* ANSEL | |||
Status: | |||
''OFFEN'' | |||
<!-- Sortierfolge auf der Kategorienseite gemäß letzten Teil des Titelpfades -> also dem Tagnamen --> | <!-- Sortierfolge auf der Kategorienseite gemäß letzten Teil des Titelpfades -> also dem Tagnamen --> | ||
[[Kategorie:GEDCOM-Tag|{{SUBPAGENAME}}]] | [[Kategorie:GEDCOM-Tag|{{SUBPAGENAME}}]] |
Version vom 6. Dezember 2009, 12:07 Uhr
Dieser Artikel hat noch wenig Substanz und ist eventuell nur mit einer Struktur oder mit minimalen Informationen angelegt worden, um die weitere Bearbeitung zu erleichtern. Falls jemand gesicherte Informationen ergänzen kann – nur zu!
Name und Bedeutung
Tag
CHAR
Formelle Bezeichnung
CHAR
Deutsche Bezeichnung
CHAR steht für Buchstabe.
Verwendung
Über das Tag CHAR soll die Kodierung der in der GEDCOM Datei benutzten Buchstaben und Zeichen festgelegt werden.
Formale Beschreibung zulässiger Werte
Basis
Basis dieser Beschreibung: GEDCOM Standard Draft 5.5.1
Der Standard erlaubt die Verwendung folgender Kodierungen:
- 8-Bit ANSEL
- ASCII (USA Version)
- UNICODE
- UTF-8
Standardfall
Jede GEDCOM Datei soll im Header angaben zur benutzten Kodierung geben. Das Format ist wie folgt:
1 CHAR <Zeichensatzkodierung>
Beispiel:
1 CHAR UTF-8
! Achtung: Es sind nur folgende Kodierungen erlaubt.
<Zeichensatzkodierung> := ANSEL |UTF-8 | UNICODE | ASCII
Optionale angaben
Versionsangabe
Zusätzlich zur Angabe der Kodierung kann weiterhin die Version des Kodierung angegeben werden, Beispiel:
1 CHAR ANSI
2 VERS 1252
Behandlung/Darstellung schwieriger Situationen
Folgende Themen sind derzeit in der GEDCOM-Arbeitsgruppe von Compgen mit den Programmentwicklern in Diskussion:
Standard Kodierung beim Export
Folgende GEDCOM 5.5.1 konforme Optionen stehen zur Zeit zur Diskussion:
- UTF-8
- erlaubt die unproblematische Darstellung von internationalen Zeichen
- wird von einigen Programmen nicht unterstützt
- ANSI
- Wird von den meisten Programmen, auch älteren Programmen problemlos eingelesen
- Ein nur eingeschränkter Zeichensatz wird unterstützt
- ASCII
- Zu limitiert
- ANSEL
- Gute unterstützung von internationalen Zeichen
- Kaum benutzt und geringe Verbreitung
- UTF-16
- Sehr gute unterstützung von internationalen Zeichen
- Wir bis jetzt noch von sehr wenigen Programmen unterstützt
Bemerkung: Unter den Überbegriff UNICODE fallen alle UTF-n Kodierungen.
Status:
OFFEN
Mindestanforderung von Kodierungen beim Export
Die Frage kam auf ob und wenn welche Kodierungen ein Programm neben dem Standart Export noch unterstützen sollte.
- UTF-8
- UTF-16
- ANSI
- ASCII
- ANSEL
Status:
OFFEN