Legutóbb frissítve: 07 Feb, 2025

Cím - GEDCOM fájlformátum és FamilySearch

Mi a GEDCOM?

GEDCOM (Genealógiai Adatkommunikáció) egy nyílt fájlformátum, amely genealógiai adatok tárolására, cseréjére és megosztására (családfa információk) lett tervezve. Széles körben használják genealógiai szoftverekben és weboldalakon, megkönnyítve a átvitelt a családfa adatok között különböző platformok között.

Illusztráció - GEDCOM fájlformátum és FamilySearch

Ki fejlesztette a GEDCOM-ot?

GEDCOM-ot a Jézus Krisztus Utolsó Napok Szentjeinek Egyháza (LDS Church) hozta létre, amely működteti a FamilySearch-t – egy nagy genealógiai kutatási szervezetet. Céljuk a genealógiai adatok kezelésének egyszerűsítése és a jobb kutatási együttműködés lehetővé tétele volt.

Hogyan működik a GEDCOM?

  • A GEDCOM fájlok egyszerű szöveges fájlok, (most már UTF-8 kódolást használnak a 7.0 verziótól kezdve).
  • Információkat tartalmaznak személyekről, például:
    • Nevek
    • Születési és halálozási dátumok
    • Családi kapcsolatok (szülők, gyermekek, házastársak)
    • Események (házasság, bevándorlás, stb.)
  • Ezeket a rekordokat metaadatok segítségével kapcsolják, biztosítva a helyes összeköttetéseket a családtagok között.

GEDCOM verziók és ipari szabványok

  • A legújabb hivatalos verzió a GEDCOM 7.0, amelyet 2021-ben adtak ki.
  • Azonban a GEDCOM 5.5.1 (1999-ből, 2019-ben véglegesítve) a legszélesebb körben használt szabvány marad.
  • Mivel a GEDCOM 5.5.1 korlátokkal rendelkezett, néhány genealógiai szoftverfejlesztő egyedi kiterjesztéseket hozott létre, például a GEDCOM 5.5 EL (Extended Locations)-t a javítás érdekében.

A GEDCOM 7.0 elfogadása

  • FamilySearch azt tervezte, hogy a GEDCOM 7.0-t 2022. harmadik negyedévében támogatja.
  • Ancestry.com szintén érdeklődést mutatott a bevezetése iránt, de még nem adott meg határozott megvalósítási dátumot.

Miért fontos a GEDCOM?

  1. Keresztplatformos kompatibilitás – Lehetővé teszi a felhasználók számára, hogy családfa adataikat különböző genealógiai weboldalak és szoftverek között mozgassák.
  2. Hosszú távú adat tárolás – Biztosítja, hogy a genealógiai adatok elérhetők maradjanak egy szabványos formátumban.
  3. Genealógiai együttműködés – Lehetővé teszi a kutatók és családtörténészek számára, hogy hatékonyan megosszák és egyesítsék az adatokat.

A GEDCOM adatmodell magyarázata

A GEDCOM egy sorvonalra kapcsolt adatmodellt használ a családi kapcsolatok strukturált szervezésére. A magcsalád koncepcióján alapul, ami azt jelenti, hogy a kapcsolatokat szülők és gyermekek szempontjából rögzíti, nem csak egyedeként.

A GEDCOM adatmodell kulcsfontosságú összetevői

  1. INDI (Egyén) rekordok

    • Minden személy a genealógiai fájlban egy INDI (egyén) rekordként van tárolva.
    • Minden egyénnek egy egyedi azonosító számot kap, hogy biztosítsa a megfelelő összekapcsolást a fájlban.
  2. FAM (Család) rekordok

    • A családi rekordok (FAM) a kapcsoló struktúra szerepét töltik be az egyének között.
    • Egy FAM rekord hozzárendel:
      • HUSB (férj) – A család apa.
      • WIFE (feleség) – A család anya.
      • CHIL (gyermek) – A pár gyermeke(i).
    • Ezek a címkék történelmi jellegűek és az eredeti GEDCOM modellen alapulnak, de ma is használják őket.
Illusztráció - A GEDCOM adatmodell magyarázata

A nemi reprezentáció evolúciója a GEDCOM-ban

  • Kezdetben a GEDCOM modellt úgy tervezték, hogy heteronormatív családszerkezetet feltételezzen, ahol egy férfi (HUSB) és nő (WIFE) gyermekeket (CHIL) nevelnek.
  • A GEDCOM 7.0 specification tisztázza, hogy ezek a kifejezések nem jelentik a nemi szerepeket vagy a biológiai szülői státuszt.
  • A frissített specifikáció lehetővé teszi:
    • Azonos nemű párok
    • Örökbefogadást, nevelőszülői ellátást és közös életvitelt
    • Rugalmasabb családszerkezeteket
  • A ‘partnerek’, ‘szülők’ vagy ‘házastársak’ kifejezéseket részesítik előnyben a FAM rekordban szereplő egyének megnevezésekor.
Illusztráció - A GEDCOM adatmodell magyarázata

Miért fontos ez?

  1. Fenntartja a strukturált kapcsolatokat – Biztosítja, hogy minden személy helyesen legyen összekapcsolva a szülőkkel, házastársakkal és gyermekekkel.
  2. Javítja a kompatibilitást – Lehetővé teszi a genealógiai szoftverek számára, hogy hatékonyan felismerjék és szervezzék a családi adatokat.
  3. Növeli a befogadást – Támogatja a változatos családszerkezeteket anélkül, hogy a hagyományos nemi szerepeket feltételezné.

A GEDCOM fájl felépítésének magyarázata

Egy GEDCOM fájl három fő szakaszból áll: a fejléc, a rekordok, és a záró rész. Minden szakasz specifikus szerepet tölt be a genealógiai adatok szervezésében, és a fájl felépítése erősen szervezett, hogy a személyek és családok közötti kapcsolatok egyértelműek és szabványosak legyenek.

1. Fejléc szakasz

  • A fejléc szakasz jelzi a GEDCOM fájl kezdetét, és tartalmazza a fájlra vonatkozó fontos metaadatokat, például a verziót (pl. GEDCOM 7.0) és bármilyen speciális beállítást vagy konfigurációt.
  • Ezt a szakaszt a HEAD rekord képviseli.

2. Rekordok szakasz

Ez a GEDCOM fájl fő része, és több különböző rekordtípust tartalmaz, mindegyik saját céljával:

  • INDI (Egyéni rekord): Egy egyéni személyt képvisel a családfában.
  • FAM (Családi rekord): Egy családot ábrázol, összekapcsolva a férjet, a feleséget és a gyermekeket.
  • SOUR (Forrás rekord): Információkat tartalmaz a data támogatásához használt forrásokról, például történelmi feljegyzésekről.
  • OBJE (Objektum rekord): Multimédia objektumokat ábrázol, például fényképeket vagy dokumentumokat, amelyek egyénekhez vagy családokhoz kapcsolódnak.
  • NOTE (Megjegyzés rekord): További megjegyzéseket vagy kommentárokat tartalmaz, amelyek extra kontextust vagy magyarázatot adhatnak egy rekordhoz.
  • REPO (Tároló rekord): Leír egy helyet, ahol genealógiai információk tárolódnak, például könyvtár vagy archívum.
  • SUBM (Beküldő rekord): A személyt vagy entitást képviseli, amely a GEDCOM fájlt beküldi.

Minden ilyen rekord hierarchikusan van felépítve, különböző szintszámok jelzik az adatok kapcsolatát. Például:

  • 0. szint a legfelső szint a legfontosabb rekordok számára, mint a HEAD, TRLR, INDI, FAM, SOUR, stb.
  • 1. szint vagy magasabb az al-szint rekordokat jelenti, például eseményeket vagy egy adott egyénhez vagy családhoz kapcsolódó kapcsolatokat.

3. Záró szakasz

  • A záró szakasz jelzi a GEDCOM fájl végét, és tartalmazza a TRLR rekordot. Ez azt jelzi, hogy a fájl befejeződött.
Illusztráció - A GEDCOM fájl felépítésének magyarázata

Hogyan működik a gyakorlatban

  • Szintszámok: Minden sor egy GEDCOM fájlban egy szintszámmal kezdődik (pl. 0, 1, 2), ahol a 0 a legfelső szintű rekordokat jelenti, a pozitív egész számok (1, 2, stb.) pedig beágyazott vagy alárendelt rekordokat jelölnek. Ez a rendszer biztosítja, hogy a családfa kapcsolatai és hierarchiái megfelelően legyenek szervezve.

    • 0. szint: HEAD (Fejléc rekord), TRLR (Záró rekord), INDI (Egyéni rekord)
    • 1. szint: MARR (Házassági esemény), BIRT (Születési esemény)
    • 2. szint: DATE (Esemény dátuma), PLAC (Esemény helye)
  • A GEDCOM fájl kézzel történő írása technikailag lehetséges, de nem felhasználóbarát, a struktúrája miatt. Sokkal könnyebb olyan szoftvert használni, amely a GEDCOM fájlokkal dolgozik, és helyesen szervezi és formázza az adatokat.

Érvényesítés és minőségellenőrzés

Mivel a GEDCOM fájloknak jól strukturáltnak kell lenniük a megfelelő használathoz és átvitelhez, léteznek eszközök a validálásukra hibák ellenőrzése céljából.

  • PhpGedView Project: Tartalmaz egy GEDCOM validátort a struktúra ellenőrzésére.
  • The Windows GEDCOM Validator: Egy önálló eszköz a GEDCOM validálásához.
  • Gedcheck: A régebbi érvényesítő eszköz, amelyet korábban az LDS Church használt.

A GEDCOM kompatibilitási kihívások

Az 2000-es évek elején a GEDCOM TestBook Project értékelte, hogy a különböző genealógiai szoftverek mennyire felelnek meg a GEDCOM 5.5 szabványnak. Az eredmények több problémát is feltártak, például adatvesztést vagy a NOTE címke helytelen olvasását, amely több szinten is megjelenhet.

A GEDCOM 7.0 célja, hogy megoldja ezeket a problémákat, és a validációs eszközök az újabb szabványhoz segítenek a kompatibilitás biztosításában különböző platformok között.

Miért fontos a GEDCOM érvényesítés?

  • Biztosítja, hogy az adatok helyesen legyenek strukturálva, és hogy a személyek, családok, események és források közötti kapcsolatok megfelelően legyenek fenntartva.
  • Segít elkerülni az adatvesztést, amikor a fájlokat genealógiai programok között cserélik.
  • Megkönnyíti a genealógusok számára az információk megosztását különböző platformok között.

Példa GEDCOM fájl

Itt egy egyszerű példa egy GEDCOM fájlra, valamint a felépítésének magyarázata:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR

Felbontás és magyarázat:

1. Fejléc szakasz (HEAD)

  • 0 HEAD: Jelzi a fájl kezdetét.
  • 1 SOUR: Jelzi a fájl forrását (pl. FamilySearch GEDCOM).
  • 2 VERS 7.0: Meghatározza a használt GEDCOM formátum verzióját (itt 7.0).
  • 1 DEST: Jelzi a célrendszert vagy a szánt rendszert az adatok számára (pl. Ancestry).
  • 1 DATE: A GEDCOM fájl létrehozásának dátuma (pl. 2025. február 5.).
  • 1 SUBM: Az beküldő rekord (@SUBM1@) mutatja, amely további információkat tartalmaz a fájlt beküldő személyről.

2. Egyéni rekordok (INDI)

  • 0 INDI @I1@: Jelzi egy egyéni rekord kezdetét egy egyedi azonosítóval (@I1@) John Doe számára.
  • 1 NAME John /Doe/: Az egyén neve (John Doe).
  • 1 SEX M: Az egyén neme (M a férfi számára).
  • 1 BIRT: Az egyén születési eseményét jelzi.
    • 2 DATE 1 JAN 1800: A születési dátum (1800. január 1.).
    • 2 PLAC New York, USA: A születés helye (New York, USA).

3. Családi rekord (FAM)

  • 0 FAM @F1@: Egy családi rekord kezdetét jelzi egy egyedi azonosítóval (@F1@).
  • 1 HUSB @I1@: Összekapcsolja a férjet (John Doe, ID @I1@).
  • 1 WIFE @I2@: Összekapcsolja a feleséget (Jane Smith, ID @I2@).
  • 1 CHIL @I3@: Összekapcsolja a gyermeket (Mary Doe, ID @I3@).

4. Második egyéni rekord (INDI)

  • 0 INDI @I2@: Jane Smith egyéni rekordjának kezdetét jelzi egy egyedi azonosítóval (@I2@).
  • 1 NAME Jane /Smith/: Az egyén neve (Jane Smith).
  • 1 SEX F: Az egyén neme (F a nő számára).
  • 1 BIRT: Az egyén születési eseményét jelzi.
    • 2 DATE 15 FEB 1805: A születési dátum (1805. február 15.).
    • 2 PLAC Boston, USA: A születés helye (Boston, USA).

5. Harmadik egyéni rekord (INDI)

  • 0 INDI @I3@: Mary Doe egyéni rekordjának kezdetét jelzi egy egyedi azonosítóval (@I3@).
  • 1 NAME Mary /Doe/: Az egyén neve (Mary Doe).
  • 1 SEX F: Az egyén neme (F a nő számára).
  • 1 BIRT: Az egyén születési eseményét jelzi.
    • 2 DATE 10 OCT 1825: A születési dátum (1825. október 10.).
    • 2 PLAC New York, USA: A születés helye (New York, USA).

6. Záró szakasz (TRLR)

  • 0 TRLR: Jelzi a GEDCOM fájl végét.

A kulcsfontosságú rekordok magyarázata

INDI (Egyéni) rekordok: Ezek személyes adatokat tartalmaznak egy adott egyénről, mint név, nem és születési dátum.
FAM (Család) rekord: Ez összekapcsolja az egyéneket családi egységekbe. Összeköti a szülőket (HUSB és WIFE) és a gyermekeket (CHIL) a egyedi azonosítóikkal.
Megjegyzés az azonosítókról: Minden rekord (egyén vagy család) egy egyedi azonosítót kap (pl. @I1@ John Doe esetén). Ezeket az azonosítókat használják a kapcsolódó rekordok összekapcsolásához, például egy gyermek szüleinek összekapcsolásához.

Kulcsfontosságú fogalmak

Szintszámok: A GEDCOM fájlok szintszámokat használnak az adatok hierarchikus szervezéséhez. A 0. szint a legfelső szintű rekordok (mint INDI, FAM), a 1. és 2. szint al-szint részleteket tartalmaz (mint események és helyek).
Perjelek közötti nevek: A GEDCOM-ban a nevek gyakran perjelek (/) közé vannak helyezve, például John /Doe/, ami megkülönbözteti a vezetéknevet a keresztnevtől.

Illusztráció - GEDCOM - A kulcsfontosságú rekordok magyarázata

Ez egy alap GEDCOM fájl, de összetettebb fájlok tartalmazhatnak részletes eseményeket (például házasságok, halálozások), forrásokat (pl. népszámlálási feljegyzések) és multimédia hivatkozásokat.

Következtetés

A GEDCOM a genealógia területén alapvető szerepet játszott, lehetővé téve a genealógiai adatok cseréjét különböző szoftverplatformok között. Szabványos formátuma lehetővé tette a kutatók, történészek és amatőrök számára, hogy hatékonyan megosszák és megőrizzék a családtörténeti adatokat. Azonban a széles körű elterjedése ellenére a GEDCOM nem mentes a korlátoktól. Olyan problémák, mint a szoftverek közötti kompatibilitás, a komplex kapcsolatok ábrázolásának lehetetlensége, és a modern adat típusok támogatásának hiánya, folyamatos fejlesztéseket vagy alternatív megoldásokat igényelnek.

Ahogy a genealógia a technológiai fejlődéssel együtt fejlődik, a GEDCOM jövője magában foglalhatja a szabvány frissítéseit vagy új formátumok kifejlesztését, amelyek jobban képesek kezelni a modern genealógiai kutatás összetettségét. Jelenleg a GEDCOM továbbra is elengedhetetlen eszköz mindenki számára, aki családfákkal dolgozik, és a struktúrájának és működésének megértése kulcsfontoságú a hatékony adatkezeléshez és megosztáshoz a genealógiai közösségben.