GOV/Mini-GOV: Unterschied zwischen den Versionen
(Hinweis zur laufenden Diskussion) |
Keine Bearbeitungszusammenfassung |
||
Zeile 1: | Zeile 1: | ||
{{Infobox| | {{Infobox|Demnächst kann wieder eine neue Mini-GOV Datei geliefert werden. Momentan wird über den Inhalt noch diskutiert, es kann eine vorläufige Version zum Mitdiskutieren bereitgestellt werden. Die bisherige Struktur hat sich durch den stark angestiegenen Informationsgehalt des GOV als nicht mehr zweckmäßig erwiesen.}} | ||
Aufgrund der Größe der MiniGOV-Datei (derzeit 4.2MB, über 250.000 Orte) ist es sinnvoll, bei Änderungen nicht immer den kompletten Datenbestand zu übertragen, sondern nur die Änderungen. | Aufgrund der Größe der MiniGOV-Datei (derzeit 4.2MB, über 250.000 Orte) ist es sinnvoll, bei Änderungen nicht immer den kompletten Datenbestand zu übertragen, sondern nur die Änderungen. |
Version vom 17. Dezember 2009, 07:24 Uhr
Aufgrund der Größe der MiniGOV-Datei (derzeit 4.2MB, über 250.000 Orte) ist es sinnvoll, bei Änderungen nicht immer den kompletten Datenbestand zu übertragen, sondern nur die Änderungen.
Die Aktualisierungen bestehen aus zwei Teilen:
- Objekte mit geänderten Angaben - Anhand der Ortskennung ist das Objekt eindeutig bestimmt und die alten Daten können durch die neuen Informationen ersetzt werden.
- veränderte Ortskennung - In seltenen Fällen (z.B. doppelte Eingaben) ist es notwendig, die Ortskennung zu ändern. Die Datei enthält (mit Tabulator getrennt) die alte und die neue Kennung. Alle Vorkommen der alten Kennung müssen durch die neue ersetzt, die Informationen zum Objekt mit der alten Kennung gelöscht werden. Ist keine neue Kennung angegeben, handelt es sich um eine - noch viel seltenere - Löschung. Falls die alte Kennung bereits verwendet wurde, bitte eine Nachricht an die GOV-Entwickler-Mailingliste.
Format
Die Liste der Objekte (utf-8 kodierter Text) enthält durch Tabulator getrennt folgende Angaben:
- Ortskennung
- heutiger (bzw. letzter) deutscher Name
- Objekttyp
- Staat
- administrative Zuordnung 1 (Bundesland)
- administrative Zuordnung 2 (Regierungsbezirk)
- administrative Zuordnung 3 (Kreis)
- Ort/Stadt (bei Orts- und Stadtteilen)
- geographische Breite (in Dezimalschreibweise, negative Werte für südliche Breite)
- geographische Länge (in Dezimalschreibweise, negative Werte für westliche Länge)
- neueste Postleitzahl oder w-Nummer
Zuordnungsverfahren - Hinweise
heutiger (letzter) deutscher Name
Das ist in einigen Forschungsgebieten nicht sinnvoll. Beispielsweise gab es zwischen 1936 bis 1940 Ortsnamenänderungen in Ost- und Westpreußen, die nur bis 1945 in Gebrauch waren. Möglichweise ist dafür eine besondere Mini-GOV Ausgabe sinnvoll, die die "normierten" Namen für ehemalige deutsche Gebiete enthält, die bei Historikern üblich sind und die sich an bestimmten Quellen, z.B. einem Gemeindelexikon mit der Volkszählung von 1905 orientieren.
Mehrdeutigkeiten
Ein besonderes Problem sind mehrdeutige Ortsnamen und mehrdeutige Zuordnungen zu einem Zeitpunkt oder Zeitraum. Das ist nicht immer vermeidbar, wenn Daten aus anderen Systemen ohne Zeitangaben übernommen werden. Bisher noch keine Lösungsansätze für den "heutigen" Namen.