Zuletzt aktualisiert: 07. Feb, 2025

Titel - GEDCOM-Dateiformat und FamilySearch

Was ist GEDCOM?

GEDCOM (Genealogical Data Communication) ist ein offenes Dateiformat, das für die Speicherung, den Austausch und die gemeinsame Nutzung genealogischer Daten (Stammbaum-Informationen) entwickelt wurde. Es wird weit verbreitet in Genealogiesoftware und -websites verwendet, um den Transfer von Familiendaten zwischen verschiedenen Plattformen zu erleichtern.

Illustration - GEDCOM-Dateiformat und FamilySearch

Wer hat GEDCOM entwickelt?

GEDCOM wurde von Der Kirche Jesu Christi der Heiligen der Letzten Tage (LDS-Kirche) entwickelt, welche FamilySearch betreibt – eine bedeutende Forschungsorganisation für Genealogie. Ihr Ziel war es, die Verwaltung genealogischer Daten zu vereinfachen und eine bessere Zusammenarbeit bei der Forschung zu ermöglichen.

Wie funktioniert GEDCOM?

  • GEDCOM-Dateien sind einfache Textdateien (in der aktuellen Version 7.0 mit UTF-8-Codierung).
  • Sie enthalten Informationen über Einzelpersonen, wie:
    • Namen
    • Geburts- und Sterbedaten
    • Familienbeziehungen (Eltern, Kinder, Ehepartner)
    • Ereignisse (Ehe, Einwanderung etc.)
  • Diese Einträge sind mit Metadaten verknüpft, um die korrekte Verbindung zwischen Familienmitgliedern sicherzustellen.

GEDCOM-Versionen und Industriestandards

  • Die neueste offizielle Version ist GEDCOM 7.0, veröffentlicht in 2021.
  • Jedoch ist GEDCOM 5.5.1 (von 1999, abgeschlossen in 2019) der am weitesten verbreitete Standard.
  • Da GEDCOM 5.5.1 Einschränkungen hatte, entwickelten einige Genealogie-Software-Entwickler benutzerdefinierte Erweiterungen wie GEDCOM 5.5 EL (Extended Locations), um Verbesserungen zu erzielen.

Einführung von GEDCOM 7.0

  • FamilySearch plante, GEDCOM 7.0 bis zum dritten Quartal 2022 zu unterstützen.
  • Auch Ancestry.com hat Interesse an der Einführung bekundet, jedoch kein konkretes Implementierungsdatum angegeben.

Warum ist GEDCOM wichtig?

  1. Plattformübergreifende Kompatibilität – Erlaubt es Nutzern, Familiendaten zwischen verschiedenen Genealogiewebseiten und -software zu übertragen.
  2. Langfristige Datenspeicherung – Stellt sicher, dass genealogische Daten im standardisierten Format zugänglich bleiben.
  3. Genealogische Zusammenarbeit – Ermöglicht es Forschern und Familienhistorikern, Daten effizient zu teilen und zusammenzuführen.

Erklärung des GEDCOM-Datenmodells

GEDCOM verwendet ein stammbaumverknüpftes Datenmodell, um Familienbeziehungen in strukturierter Weise zu organisieren. Es basiert auf dem Konzept der Kernfamilie, das bedeutet, dass Beziehungen in Bezug auf Eltern und Kinder und nicht nur als Einzelpersonen aufgezeichnet werden.

Schlüsselkomponenten des GEDCOM-Datenmodells

  1. INDI (Individual) Datensätze

    • Jede Person im Genealogiedatei wird als INDI (Individuum) Datensatz gespeichert.
    • Jeder Einzelne erhält eine eindeutige ID-Nummer, um die korrekte Verknüpfung in der Datei sicherzustellen.
  2. FAM (Familien) Datensätze

    • Familiendatensätze (FAM) dienen als Verknüpfungsstruktur zwischen Einzelpersonen.
    • Ein FAM-Datensatz weist zu:
      • HUSB (Ehemann) – Der Vater in der Familie.
      • WIFE (Ehefrau) – Die Mutter in der Familie.
      • CHIL (Kind) – Die Kinder des Paares.
    • Diese Bezeichnungen sind historisch und basieren auf dem ursprünglichen GEDCOM-Modell, werden aber auch heute noch verwendet.
Illustration - Erklärung des GEDCOM-Datenmodells

Entwicklung der Geschlechterdarstellung in GEDCOM

  • Ursprünglich war das GEDCOM-Modell so entworfen, dass es eine heteronormative Familienstruktur annahm, in der ein Mann (HUSB) und eine Frau (WIFE) Kinder (CHIL) haben.
  • Die GEDCOM 7.0-Spezifikation stellt klar, dass diese Begriffe keine Geschlechterrollen oder biologische Elternschaft implizieren.
  • Die aktualisierte Spezifikation erlaubt:
    • Gleichgeschlechtliche Paare
    • Adoption, Pflege und Lebensgemeinschaften
    • Flexiblere Familienstrukturen
  • Die Begriffe ‘Partner’, ‘Eltern’ oder ‘Ehepartner’ werden jetzt bevorzugt, wenn man sich auf Einzelpersonen in einem FAM-Datensatz bezieht.
Illustration - Erklärung des GEDCOM-Datenmodells

Warum ist dies wichtig?

  1. Erhält strukturierte Beziehungen – Stellt sicher, dass jede Person korrekt mit Eltern, Ehepartnern und Kindern verknüpft ist.
  2. Verbessert die Kompatibilität – Ermöglicht es der Genealogie-Software, Familieninformationen effizient zu erkennen und zu organisieren.
  3. Erhöht die Inklusivität – Unterstützt vielfältige Familienstrukturen ohne Annahme traditioneller Geschlechterrollen.

Erklärung der Struktur einer GEDCOM-Datei

Eine GEDCOM-Datei besteht aus drei Hauptabschnitten: dem Header, den Aufzeichnungen und dem Trailer. Jeder Abschnitt spielt eine spezifische Rolle in der Organisation genealogischer Daten, und die Struktur der Datei ist hochgradig organisiert, um sicherzustellen, dass Beziehungen zwischen Einzelpersonen und Familien klar und standardisiert sind.

1. Header Bereich

  • Der Header-Bereich markiert den Beginn der GEDCOM-Datei und enthält wichtige Metadaten über die Datei selbst, wie ihre Version (z. B. GEDCOM 7.0) und spezielle Einstellungen oder Konfigurationen für die Datei.
  • Dieser Abschnitt ist durch den HEAD-Datensatz dargestellt.

2. Aufzeichnungsbereich

Dies ist der Hauptteil der GEDCOM-Datei und besteht aus verschiedenen Aufzeichnungstypen, die jeweils einem spezifischen Zweck dienen:

  • INDI (Individual Record): Repräsentiert eine Einzelperson im Stammbaum.
  • FAM (Family Record): Repräsentiert eine Familie, die einen Ehemann, eine Ehefrau und Kinder verbindet.
  • SOUR (Source Record): Enthält Informationen über die verwendeten Quellen zur Unterstützung der Daten, wie historische Aufzeichnungen.
  • OBJE (Object Record): Repräsentiert Multimedia-Objekte, wie Fotos oder Dokumente, die mit Einzelpersonen oder Familien verbunden sind.
  • NOTE (Note Record): Enthält zusätzliche Notizen oder Kommentare, die für einen Datensatz zusätzlichen Kontext oder Erklärungen bieten können.
  • REPO (Repository Record): Beschreibt einen Ort, an dem genealogische Informationen gespeichert sind, wie eine Bibliothek oder ein Archiv.
  • SUBM (Submitter Record): Repräsentiert die Person oder Einrichtung, die die GEDCOM-Datei einreicht.

Jeder dieser Datensätze ist hierarchisch strukturiert, wobei verschiedene Ebenenummern anzeigen, wie die Daten miteinander in Beziehung stehen. Beispielsweise:

  • Ebene 0 ist die oberste Ebene für die wichtigsten Datensätze, wie HEAD, TRLR, INDI, FAM, SOUR etc.
  • Ebene 1 oder höher repräsentiert untergeordnete Datensätze, wie Ereignisse oder Beziehungen, die mit einer bestimmten Einzelperson oder Familie verbunden sind.

3. Trailer Bereich

  • Der Trailer-Bereich markiert das Ende der GEDCOM-Datei und enthält den TRLR-Datensatz. Er signalisiert, dass die Datei beendet ist.
Illustration - Erklärung der Struktur einer GEDCOM-Datei

Wie es in der Praxis funktioniert

  • Ebenennummern: Jede Zeile in einer GEDCOM-Datei beginnt mit einer Ebenennummer (z. B. 0, 1, 2), wobei 0 Top-Level-Datensätze darstellt und positive Ganzzahlen (1, 2, etc.) geschachtelte oder untergeordnete Datensätze darstellen. Dieses System stellt sicher, dass Beziehungen und Hierarchien im Stammbaum korrekt organisiert sind.

    Zum Beispiel:

    • Ebene 0: HEAD (Header Datensatz), TRLR (Trailer Datensatz), INDI (Individual Datensatz)
    • Ebene 1: MARR (Ehe-Ereignis), BIRT (Geburtsereignis)
    • Ebene 2: DATE (Datum des Ereignisses), PLAC (Ort des Ereignisses)
  • Eine GEDCOM-Datei von Hand zu schreiben ist technisch möglich, aber nicht benutzerfreundlich aufgrund ihrer strukturierten Natur. Es ist viel einfacher, Software zu verwenden, die für die Arbeit mit GEDCOM-Dateien entwickelt wurde und hilft, Daten korrekt zu organisieren und zu formatieren.

Validierung und Qualitätssicherung

  • Da GEDCOM-Dateien gut strukturiert sein müssen, um ordnungsgemäß genutzt und übertragen zu werden, gibt es Tools, um sie auf Fehler zu überprüfen.
    • PhpGedView Projekt: Beinhaltet einen GEDCOM-Validator zur Überprüfung der Struktur.
    • Der Windows GEDCOM Validator: Ein eigenständiges Tool zur GEDCOM-Validierung.
    • Gedcheck: Das ältere Validierungstool, das früher von der LDS-Kirche verwendet wurde.

Herausforderungen mit der GEDCOM-Kompatibilität

  • In den frühen 2000er Jahren bewertete das GEDCOM TestBook Projekt, wie gut verschiedene Genealogie-Software mit dem GEDCOM 5.5 Standard konform ist. Die Ergebnisse zeigten mehrere Probleme auf, wie Datenverlust oder fehlerhaftes Lesen des NOTE-Tags, das auf mehreren Ebenen auftreten kann.

  • GEDCOM 7.0 zielt darauf ab, einige dieser Probleme zu lösen, und es gibt Validierungstools für diesen neueren Standard, um die Kompatibilität über verschiedene Plattformen hinweg sicherzustellen.

Warum ist die GEDCOM-Validierung wichtig?

  • Stellt sicher, dass Daten korrekt strukturiert sind und dass Beziehungen zwischen Einzelpersonen, Familien, Ereignissen und Quellen ordnungsgemäß gepflegt werden.
  • Hilft, Datenverluste beim Übertragen von Dateien zwischen Genealogieprogrammen zu vermeiden.
  • Erleichtert es Genealogen, Informationen über verschiedene Plattformen auszutauschen.

Beispiel einer GEDCOM-Datei

Hier ist ein einfaches Beispiel einer GEDCOM-Datei und eine Erklärung ihrer Struktur:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR

Aufschlüsselung und Erklärung:

1. Header Bereich (HEAD)

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
  • 0 HEAD: Markiert den Beginn der Datei.
  • 1 SOUR: Gibt die Quelle der Datei an (z. B. FamilySearch GEDCOM).
  • 2 VERS 7.0: Gibt die verwendete GEDCOM-Formatversion an (7.0 hier).
  • 1 DEST: Gibt die geplante Zielplattform oder das System für die Daten an (z. B. Ancestry).
  • 1 DATE: Das Datum, an dem die GEDCOM-Datei erstellt wurde (z. B. 5. Februar 2025).
  • 1 SUBM: Verweist auf den Submitter-Datensatz (@SUBM1@), der mehr Informationen über die Person enthält, die die Datei einreicht.

2. Einzelpersonen-Datensätze (INDI)

0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
  • 0 INDI @I1@: Markiert den Beginn eines Einzelpersonen-Datensatzes mit einer eindeutigen ID (@I1@) für John Doe.
  • 1 NAME John /Doe/: Der Name der Einzelperson (John Doe).
  • 1 SEX M: Geschlecht der Einzelperson (M für Männlich).
  • 1 BIRT: Bezeichnet das Geburtsereignis der Einzelperson.
    • 2 DATE 1 JAN 1800: Das Geburtsdatum (1. Januar 1800).
    • 2 PLAC New York, USA: Der Geburtsort (New York, USA).

3. Familien-Datensatz (FAM)

0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
  • 0 FAM @F1@: Markiert den Beginn eines Familien-Datensatzes mit einer eindeutigen ID (@F1@).
  • 1 HUSB @I1@: Verknüpft den Ehemann (John Doe, ID @I1@).
  • 1 WIFE @I2@: Verknüpft die Ehefrau (Jane Smith, ID @I2@).
  • 1 CHIL @I3@: Verknüpft das Kind (Mary Doe, ID @I3@).

4. Zweiter Einzelpersonen-Datensatz (INDI)

0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
  • 0 INDI @I2@: Markiert den Beginn von Jane Smiths Einzelpersonen-Datensatz mit einer eindeutigen ID (@I2@).
  • 1 NAME Jane /Smith/: Der Name der Einzelperson (Jane Smith).
  • 1 SEX F: Geschlecht der Einzelperson (F für Weiblich).
  • 1 BIRT: Bezeichnet das Geburtsereignis der Einzelperson.
    • 2 DATE 15 FEB 1805: Das Geburtsdatum (15. Februar 1805).
    • 2 PLAC Boston, USA: Der Geburtsort (Boston, USA).

5. Dritter Einzelpersonen-Datensatz (INDI)

0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
  • 0 INDI @I3@: Markiert den Beginn von Mary Does Einzelpersonen-Datensatz mit einer eindeutigen ID (@I3@).
  • 1 NAME Mary /Doe/: Der Name der Einzelperson (Mary Doe).
  • 1 SEX F: Geschlecht der Einzelperson (F für Weiblich).
  • 1 BIRT: Bezeichnet das Geburtsereignis der Einzelperson.
    • 2 DATE 10 OCT 1825: Das Geburtsdatum (10. Oktober 1825).
    • 2 PLAC New York, USA: Der Geburtsort (New York, USA).

6. Trailer Bereich (TRLR)

0 TRLR
  • 0 TRLR: Markiert das Ende der GEDCOM-Datei.

Erklärung der Schlüsseldatensätze

  • INDI (Individual) Datensätze: Diese enthalten persönliche Details über eine bestimmte Einzelperson, wie Name, Geschlecht und Geburtsdatum.
  • FAM (Family) Datensatz: Dieser verknüpft Einzelpersonen zu Familieneinheiten. Er verbindet Eltern (HUSB und WIFE) und Kinder (CHIL) mit ihren eindeutigen IDs.
  • Hinweis zu IDs: Jeder Datensatz (Einzelperson oder Familie) hat eine eindeutige ID, die ihm zugewiesen ist (z. B. @I1@ für John Doe). Diese IDs werden verwendet, um verwandte Datensätze zu verknüpfen, wie z. B. das Verknüpfen eines Kindes mit seinen Eltern.

Schlüsselkonzepte

  • Ebenennummern: GEDCOM-Dateien verwenden Ebenennummern, um Daten in einer hierarchischen Struktur zu organisieren. Ebene 0 ist für Top-Level-Datensätze (wie INDI, FAM), und Ebene 1 und 2 werden für untergeordnete Details (wie Ereignisse und Orte) verwendet.
  • Namen in Schrägstrichen: Namen in GEDCOM sind oft in Schrägstriche eingeschlossen, wie John /Doe/, was den Nachnamen von dem Vornamen unterscheidet.
Illustration - GEDCOM - Erklärung der Schlüsseldatensätze

Dies ist eine grundlegende GEDCOM-Datei, aber komplexere Dateien können detailliertere Ereignisse (wie Hochzeiten, Todesfälle), Quellen (z. B. Volkszählungsdaten) und Multimedia-Referenzen enthalten.

Fazit

GEDCOM war ein Grundstein im Bereich der Genealogie und ermöglichte den Austausch genealogischer Daten über verschiedene Softwareplattformen hinweg. Sein standardisiertes Format hat es Forschern, Historikern und Hobbyisten ermöglicht, Stammbäume effizient zu teilen und zu bewahren. Trotz seiner weitverbreiteten Verwendung bleibt GEDCOM nicht ohne Einschränkungen. Probleme wie die Kompatibilität zwischen Softwareprogrammen, die Unfähigkeit, komplexe Beziehungen darzustellen, und das fehlende Unterstützen moderner Datentypen verdeutlichen die Notwendigkeit für laufende Verbesserungen oder alternative Lösungen.

Da die Genealogie mit fortschreitender Technologie weiterhin wächst, könnte die Zukunft von GEDCOM Updates am Standard oder die Entwicklung neuer Formate beinhalten, die besser auf die Komplexität moderner genealogischer Forschung abgestimmt sind. Vorläufig bleibt GEDCOM ein wesentliches Werkzeug für jeden, der mit Familienstammbäumen arbeitet, und das Verständnis seiner Struktur und Funktionalität ist entscheidend für effektives Datenmanagement und den Austausch in der Genealogie-Community.