GOV/Mini-GOV: Unterschied zwischen den Versionen

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
< GOV
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
{{Infobox|Demnächst kann wieder eine neue Mini-GOV Datei geliefert werden. Momentan wird über den Inhalt noch diskutiert, es kann eine vorläufige Version zum Mitdiskutieren bereitgestellt werden. Die bisherige Struktur hat sich durch den stark angestiegenen Informationsgehalt des GOV als nicht mehr zweckmäßig erwiesen.}}
Das Mini-GOV enthält einen kompakten Ausschnitt der im GOV enthaltenen Informationen. Es kann z.B. verwendet werden, um eine umfangreiche Ortsverwaltung in einem Genealogieprogramm zu realisieren.


Aufgrund der Größe der MiniGOV-Datei (derzeit 4.2MB, über 250.000 Orte) ist es sinnvoll, bei Änderungen nicht immer den kompletten Datenbestand zu übertragen, sondern nur die Änderungen.
Es gibt mehrere Datenformate mit verschiedenem Informationsgehalt und regionaler Filterung zur Auswahl. Bei allen Dateien handelt es sich um UTF-8 Textdateien, bei denen die einzelnen Felder mit Tabulator getrennt sind.


Die Aktualisierungen bestehen aus zwei Teilen:
* <tt>gov-data_''Datum''.txt</tt> - gesamter Bereich des GOV, Zuordnungen werden mit Kennungen angegeben
* Objekte mit geänderten Angaben - Anhand der Ortskennung ist das Objekt eindeutig bestimmt und die alten Daten können durch die neuen Informationen ersetzt werden.
* <tt>gov-data-names_''Datum''.txt</tt> - gesamter Bereich des GOV, Zuordnungen werden mit Namen angegeben, lassen sich gut durchsuchen, sind aber ggf. nicht mehr eindeutig
* veränderte Ortskennung - In seltenen Fällen (z.B. doppelte Eingaben) ist es notwendig, die Ortskennung zu ändern. Die Datei enthält (mit Tabulator getrennt) die alte und die neue Kennung. Alle Vorkommen der alten Kennung müssen durch die neue ersetzt, die Informationen zum Objekt mit der alten Kennung gelöscht werden. Ist keine neue Kennung angegeben, handelt es sich um eine - noch viel seltenere - Löschung. Falls die alte Kennung bereits verwendet wurde, bitte eine Nachricht an die GOV-Entwickler-Mailingliste.
* <tt>gov-data_D_''Datum''.txt</tt> - wie <tt>gov-data_''Datum''.txt</tt>, jedoch nur Orte, die zu Deutschland gehören
* <tt>gov-data_A_''Datum''.txt</tt> - wie <tt>gov-data_''Datum''.txt</tt>, jedoch nur Orte, die zu Österreich gehören
* <tt>gov-data_PL_''Datum''.txt</tt> - wie <tt>gov-data_''Datum''.txt</tt>, jedoch nur Orte, die zu Polen gehören
* etc.
* <tt>gemeinden1900.csv</tt> - Liste der Gemeinden des Deutschen Reiches (ohne Preußen) mit Stand 1900
* <tt>wohnplätze1900.csv</tt> - Liste der Wohnplätze des Deutschen Reiches (ohne Preußen) mit Stand 1900
* <tt>preussen_gemeinden1900.csv</tt> - Liste der Gemeinden Preußens mit Stand 1900
* <tt>preussen_wohnplätze1900.csv</tt> - Liste der Gemeinden Preußens mit Stand 1900


== Format ==
== Datenformat ==
Die Liste der Objekte (utf-8 kodierter Text) enthält durch Tabulator getrennt folgende Angaben:
=== gov-data_….txt ===
* Ortskennung
* GOV-Kennung
* heutiger (bzw. letzter) deutscher Name  
* Objekttyp als Text
* Objekttyp
* Objekttyp als Zahl
* aktueller Name
* letzter deutscher Name (soweit vorhanden)
* Staat
* Staat
* administrative Zuordnung 1 (Bundesland)
* adm. Zuordnung 1 (siehe Tabelle unten)
* administrative Zuordnung 2 (Regierungsbezirk)
* adm. Zuordnung 2
* administrative Zuordnung 3 (Kreis)
* adm. Zuordnung 3
* Ort/Stadt (bei Orts- und Stadtteilen)
* adm. Zuordnung 4
* geographische Breite (in Dezimalschreibweise, negative Werte für südliche Breite)
* geographische Länge (in Dezimalschreibweise, negative Werte für westliche Länge)
* neueste Postleitzahl oder w-Nummer
 
== Zuordnungsverfahren - Hinweise ==
''heutiger (letzter) deutscher Name''<br/>
Das ist in einigen Forschungsgebieten nicht sinnvoll. Beispielsweise gab es zwischen 1936 bis 1940 Ortsnamenänderungen in Ost- und Westpreußen, die nur bis 1945 in Gebrauch waren. Möglichweise ist dafür eine besondere Mini-GOV Ausgabe sinnvoll, die die "normierten" Namen für ehemalige deutsche Gebiete enthält, die bei Historikern üblich sind und die sich an bestimmten Quellen, z.B. einem Gemeindelexikon mit der Volkszählung von 1905 orientieren. <br/>
 
''Mehrdeutigkeiten''<br/>
Ein besonderes Problem sind mehrdeutige Ortsnamen und mehrdeutige Zuordnungen zu einem Zeitpunkt oder Zeitraum. Das ist nicht immer vermeidbar, wenn Daten aus anderen Systemen ohne Zeitangaben übernommen werden. Bisher noch keine Lösungsansätze für den "heutigen" Namen. <br/>
 


== Aktuelle Zuordnungstabelle ==  
== Aktuelle Zuordnungstabelle ==  

Version vom 16. November 2010, 07:36 Uhr

Das Mini-GOV enthält einen kompakten Ausschnitt der im GOV enthaltenen Informationen. Es kann z.B. verwendet werden, um eine umfangreiche Ortsverwaltung in einem Genealogieprogramm zu realisieren.

Es gibt mehrere Datenformate mit verschiedenem Informationsgehalt und regionaler Filterung zur Auswahl. Bei allen Dateien handelt es sich um UTF-8 Textdateien, bei denen die einzelnen Felder mit Tabulator getrennt sind.

  • gov-data_Datum.txt - gesamter Bereich des GOV, Zuordnungen werden mit Kennungen angegeben
  • gov-data-names_Datum.txt - gesamter Bereich des GOV, Zuordnungen werden mit Namen angegeben, lassen sich gut durchsuchen, sind aber ggf. nicht mehr eindeutig
  • gov-data_D_Datum.txt - wie gov-data_Datum.txt, jedoch nur Orte, die zu Deutschland gehören
  • gov-data_A_Datum.txt - wie gov-data_Datum.txt, jedoch nur Orte, die zu Österreich gehören
  • gov-data_PL_Datum.txt - wie gov-data_Datum.txt, jedoch nur Orte, die zu Polen gehören
  • etc.
  • gemeinden1900.csv - Liste der Gemeinden des Deutschen Reiches (ohne Preußen) mit Stand 1900
  • wohnplätze1900.csv - Liste der Wohnplätze des Deutschen Reiches (ohne Preußen) mit Stand 1900
  • preussen_gemeinden1900.csv - Liste der Gemeinden Preußens mit Stand 1900
  • preussen_wohnplätze1900.csv - Liste der Gemeinden Preußens mit Stand 1900

Datenformat

gov-data_….txt

  • GOV-Kennung
  • Objekttyp als Text
  • Objekttyp als Zahl
  • aktueller Name
  • letzter deutscher Name (soweit vorhanden)
  • Staat
  • adm. Zuordnung 1 (siehe Tabelle unten)
  • adm. Zuordnung 2
  • adm. Zuordnung 3
  • adm. Zuordnung 4

Aktuelle Zuordnungstabelle

Staat GOV-Kennung des Staates Sprache adm. Zuordnung 1 adm. Zuordnung 2 adm. Zuordnung 3 adm. Zuordnung 4
A object_215340 deu Bundesland (7) Bezirkshauptmannschaft/Politischer Bezirk (146) Flecken (14), Gemeinde (18), Markt (145), Stadt (150)
B object_258578 dut Region (137) Provinz (45) Bezirk (5) Gemeinde (18)
CH object_191050 deu Kanton (25) Flecken (14), Gemeinde (18), Markt (145), Stadt (150)
CZ object_262328 cze Region (137) Kreis (32) Flecken (14), Gemeinde (18), Markt (145), Stadt (150)
D object_149273 deu Bundesland (7) Regierungsbezirk (46) Kreis (32), Landkreis (36), Stadtteil (54), kreisfreie Stadt (95) Flecken (14), Gemeinde (18), Markt (145), Stadt (150)
DK object_190123 dan Region (137) kommune (143)
EST object_1293 est
F object_190339 fre région (133) Departement (10) arrondissement (134) commune (136)
NL object_216948 dut Provinz (45) Gemeinde (18)
RUS object_214266 rus
S object_217421 swe Provinz (168) Gemeinde (169)
PL object_190086 pol Wojewodschaft (59) Kreis (32) Landgemeinde (85), Stadt (150), Stadt- und Landgemeinde (162)