Ultimo aggiornamento: 07 Feb, 2025

Titolo - Formato del file GEDCOM e FamilySearch

Cos’è GEDCOM?

GEDCOM (Genealogical Data Communication) è un formato file aperto progettato per archiviare, scambiare e condividere dati genealogici (informazioni sull’albero genealogico). È ampiamente utilizzato nei software e nei siti web di genealogia, rendendo più facile trasferire i dati degli alberi genealogici tra diverse piattaforme.

Illustrazione - Formato del file GEDCOM e FamilySearch

Chi ha sviluppato GEDCOM?

GEDCOM è stato creato da La Chiesa di Gesù Cristo dei Santi degli Ultimi Giorni (LDS Church), che gestisce FamilySearch, una delle principali organizzazioni di ricerca genealogica. Il loro obiettivo era semplificare la gestione dei dati genealogici e consentire una migliore collaborazione nella ricerca.

Come funziona GEDCOM?

  • I file GEDCOM sono file di testo semplice (ora usando codifica UTF-8 a partire dalla versione 7.0).
  • Contengono informazioni sugli individui, come:
    • Nomi
    • Date di nascita e morte
    • Relazioni familiari (genitori, figli, coniugi)
    • Eventi (matrimonio, immigrazione, ecc.)
  • Questi record sono collegati utilizzando metadati, garantendo connessioni corrette tra i membri della famiglia.

Versioni GEDCOM e standard del settore

  • L’ultima versione ufficiale è GEDCOM 7.0, rilasciata nel 2021.
  • Tuttavia, GEDCOM 5.5.1 (del 1999, finalizzata nel 2019) **rimane lo standard più ampiamente utilizzato.
  • Poiché GEDCOM 5.5.1 presentava limitazioni, alcuni sviluppatori di software genealogico hanno creato estensioni personalizzate come GEDCOM 5.5 EL (Extended Locations) per migliorarlo.

Adozione di GEDCOM 7.0

  • FamilySearch prevedeva di supportare GEDCOM 7.0 entro il terzo trimestre del 2022.
  • Anche Ancestry.com ha mostrato interesse per l’adozione, ma non ha fornito una data di implementazione precisa.

Perché GEDCOM è importante?

  1. Compatibilità tra piattaforme – Consente agli utenti di spostare i dati del proprio albero genealogico tra diversi siti web e software di genealogia.
  2. Conservazione dei dati a lungo termine – Garantisce che i dati genealogici rimangano accessibili in un formato standardizzato.
  3. Collaborazione genealogica – Permette a ricercatori e storici familiari di condividere e unire dati in modo efficiente.

Spiegazione del modello di dati GEDCOM

GEDCOM utilizza un modello di dati basato su discendenza per organizzare relazioni familiari in modo strutturato. Si basa sul concetto di famiglia nucleare, il che significa che registra le relazioni in termini di genitori e figli piuttosto che solo individui.

Componenti chiave del modello di dati GEDCOM

  1. Record INDI (Individuali)

    • Ogni persona nel file genealogico è memorizzata come un record INDI (individuale).
    • Ad ogni individuo viene assegnato un ID unico per garantire il collegamento corretto nel file.
  2. Record FAM (Familiari)

    • I record familiari (FAM) fungono da struttura di collegamento tra individui.
    • Un record FAM assegna:
      • HUSB (marito) – Il padre nella famiglia.
      • WIFE (moglie) – La madre nella famiglia.
      • CHIL (figlio) – I figli della coppia.
    • Queste etichette sono storiche e basate sul modello originario GEDCOM, ma sono ancora utilizzate oggi.
Illustrazione - Spiegazione del modello di dati GEDCOM

Evoluzione della rappresentazione di genere in GEDCOM

  • Inizialmente, il modello GEDCOM è stato progettato assumendo una struttura familiare eteronormativa, in cui un maschio (HUSB) e una femmina (WIFE) hanno figli (CHIL).
  • La specifica GEDCOM 7.0 chiarisce che questi termini non implicano ruoli di genere o genitorialità biologica.
  • La specifica aggiornata consente:
    • Coppie dello stesso sesso
    • Adozione, affidamento e convivenza
    • Strutture familiari più flessibili
  • I termini ‘partner’, ‘genitori’ o ‘coniugi’ sono ora preferiti quando si fa riferimento agli individui in un record FAM.
Illustrazione - Spiegazione del modello di dati GEDCOM

Perché è importante?

  1. Mantiene relazioni strutturate – Garantisce che ogni persona sia correttamente collegata a genitori, coniugi e figli.
  2. Migliora la compatibilità – Permette al software genealogico di riconoscere e organizzare i dati familiari in modo efficiente.
  3. Aumenta l’inclusività – Supporta strutture familiari diverse senza presupporre ruoli di genere tradizionali.

Spiegazione della struttura di un file GEDCOM

Un file GEDCOM è composto da tre sezioni principali: l’intestazione, i record e il trailer. Ogni sezione svolge un ruolo specifico nell’organizzazione dei dati genealogici, e la struttura del file è altamente organizzata per garantire che le relazioni tra individui e famiglie siano chiare e standardizzate.

1. Sezione di Intestazione

  • La sezione di intestazione segna l’inizio del file GEDCOM e include importanti metadati sul file stesso, come la sua versione (es. GEDCOM 7.0) e eventuali impostazioni o configurazioni speciali per il file.
  • Questa sezione è rappresentata dal record HEAD.

2. Sezione dei Record

Questa è la parte principale del file GEDCOM e consiste in diversi tipi di record, ognuno con uno scopo specifico:

  • Record INDI (Individuale): Rappresenta una persona nell’albero genealogico.
  • Record FAM (Familiare): Rappresenta una famiglia, collegando un marito, una moglie e i figli.
  • Record SOUR (Fonte): Contiene informazioni sulle fonti utilizzate a supporto dei dati, come i documenti storici.
  • Record OBJE (Oggetto): Rappresenta oggetti multimediali, come foto o documenti, associati a individui o famiglie.
  • Record NOTE (Nota): Contiene note aggiuntive o commenti che possono fornire contesto o spiegazioni extra per un record.
  • Record REPO (Archivio): Descrive un luogo in cui sono conservate informazioni genealogiche, come una biblioteca o un archivio.
  • Record SUBM (Consegnante): Rappresenta la persona o l’entità che consegna il file GEDCOM.

Ciascuno di questi record è strutturato gerarchicamente, con diversi livelli numerici che indicano come i dati sono correlati. Ad esempio:

  • Livello 0 è il livello più alto per i record più significativi, come HEAD, TRLR, INDI, FAM, SOUR, ecc.
  • Livello 1 o superiore rappresenta i sottomovimenti, come eventi o relazioni legati a un individuo o famiglia specifici.

3. Sezione Trailer

  • La sezione trailer segna la fine del file GEDCOM e contiene il record TRLR. Indica che il file è concluso.
Illustrazione - Spiegazione della struttura di un file GEDCOM

Come funziona nella pratica

  • Numeri di Livello: Ogni riga in un file GEDCOM inizia con un numero di livello (es. 0, 1, 2), dove 0 rappresenta i record di primo livello, e numeri interi positivi (1, 2, ecc.) rappresentano i record annidati o subordinati. Questo sistema assicura che le relazioni e le gerarchie all’interno dell’albero genealogico siano correttamente organizzate.

    Ad esempio:

    • Livello 0: HEAD (Record di Intestazione), TRLR (Record di Chiusura), INDI (Record Individuale)
    • Livello 1: MARR (Evento di Matrimonio), BIRT (Evento di Nascita)
    • Livello 2: DATE (Data dell’evento), PLAC (Luogo dell’evento)
  • Scrivere a mano un file GEDCOM è tecnicamente possibile, ma non è amichevole per l’utente a causa della sua natura strutturata. È molto più facile usare software progettati per lavorare con i file GEDCOM, che aiutano a organizzare e formattare i dati correttamente.

Validazione e controllo di qualità

  • Poiché i file GEDCOM devono essere ben strutturati per un uso e un trasferimento corretti, esistono strumenti per validarli per errori.
    • Progetto PhpGedView: Include un validatore GEDCOM per controllare la struttura.
    • Il Windows GEDCOM Validator: Uno strumento autonomo per la validazione GEDCOM.
    • Gedcheck: Il vecchio strumento di validazione, in precedenza utilizzato da LDS Church.

Sfide con la compatibilità GEDCOM

  • Nei primi anni 2000, il Progetto TestBook GEDCOM ha valutato quanto bene diversi software genealogici si conformassero allo standard GEDCOM 5.5. I risultati hanno rivelato diversi problemi, come la perdita di dati o la lettura impropria del tag NOTE, che può comparire a più livelli.

  • GEDCOM 7.0 mira a risolvere alcune di queste problematiche, e strumenti di validazione per questo nuovo standard esistono per aiutare a garantire la compatibilità tra le diverse piattaforme.

Perché la validazione GEDCOM è importante?

  • Garantisce che i dati siano strutturati correttamente e che le relazioni tra individui, famiglie, eventi e fonti siano mantenute in modo appropriato.
  • Aiuta a evitare perdite di dati durante il trasferimento di file tra programmi genealogici.
  • Facilita la condivisione delle informazioni tra diverse piattaforme per i genealogisti.

Esempio di file GEDCOM

Ecco un semplice esempio di file GEDCOM e una spiegazione della sua struttura:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR

Scomposizione e spiegazione:

1. Sezione di Intestazione (HEAD)

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
  • 0 HEAD: Segna l’inizio del file.
  • 1 SOUR: Indica la fonte del file (es. FamilySearch GEDCOM).
  • 2 VERS 7.0: Specifica la versione del formato GEDCOM utilizzata (7.0 in questo caso).
  • 1 DEST: Indica la destinazione o il sistema previsto per i dati (es. Ancestry).
  • 1 DATE: La data in cui il file GEDCOM è stato creato (es. 5 febbraio 2025).
  • 1 SUBM: Indica il record del consegnante (@SUBM1@), che avrebbe più informazioni sulla persona che consegna il file.

2. Record Individuali (INDI)

0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
  • 0 INDI @I1@: Segna l’inizio di un record individuale con un ID unico (@I1@) per John Doe.
  • 1 NAME John /Doe/: Il nome dell’individuo (John Doe).
  • 1 SEX M: Il genere dell’individuo (M per Maschio).
  • 1 BIRT: Indica l’evento di nascita dell’individuo.
    • 2 DATE 1 JAN 1800: La data di nascita (1 gennaio 1800).
    • 2 PLAC New York, USA: Il luogo di nascita (New York, USA).

3. Record Familiare (FAM)

0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
  • 0 FAM @F1@: Segna l’inizio di un record familiare con un ID unico (@F1@).
  • 1 HUSB @I1@: Collega il marito (John Doe, ID @I1@).
  • 1 WIFE @I2@: Collega la moglie (Jane Smith, ID @I2@).
  • 1 CHIL @I3@: Collega il figlio (Mary Doe, ID @I3@).

4. Secondo Record Individuale (INDI)

0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
  • 0 INDI @I2@: Segna l’inizio del record individuale di Jane Smith con un ID unico (@I2@).
  • 1 NAME Jane /Smith/: Il nome dell’individuo (Jane Smith).
  • 1 SEX F: Il genere dell’individuo (F per Femmina).
  • 1 BIRT: Indica l’evento di nascita dell’individuo.
    • 2 DATE 15 FEB 1805: La data di nascita (15 febbraio 1805).
    • 2 PLAC Boston, USA: Il luogo di nascita (Boston, USA).

5. Terzo Record Individuale (INDI)

0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
  • 0 INDI @I3@: Segna l’inizio del record individuale di Mary Doe con un ID unico (@I3@).
  • 1 NAME Mary /Doe/: Il nome dell’individuo (Mary Doe).
  • 1 SEX F: Il genere dell’individuo (F per Femmina).
  • 1 BIRT: Indica l’evento di nascita dell’individuo.
    • 2 DATE 10 OCT 1825: La data di nascita (10 ottobre 1825).
    • 2 PLAC New York, USA: Il luogo di nascita (New York, USA).

6. Sezione Trailer (TRLR)

0 TRLR
  • 0 TRLR: Segna la fine del file GEDCOM.

Spiegazione dei record chiave

  • Record INDI (Individuali): Contengono dettagli personali su un individuo specifico, come nome, genere e data di nascita.
  • Record FAM (Familiari): Collega gli individui per formare unità familiari. Connette genitori (HUSB e WIFE) e figli (CHIL) usando i loro ID unici.
  • Nota sugli ID: Ogni record (individuale o familiare) ha un ID unico assegnato (es. @I1@ per John Doe). Questi ID vengono utilizzati per collegare record correlati, come collegare un figlio ai suoi genitori.

Concetti chiave

  • Numeri di Livello: I file GEDCOM utilizzano numeri di livello per organizzare i dati in una struttura gerarchica. Livello 0 è per i record di primo livello (come INDI, FAM) e Livello 1 e 2 vengono utilizzati per dettagli di sottolivello (come eventi e luoghi).
  • Nomi tra Barre: I nomi in GEDCOM sono spesso racchiusi in barre, come John /Doe/, che differenziano il cognome dal nome.
Illustrazione - GEDCOM - Spiegazione dei record chiave

Questo è un file GEDCOM di base, ma file più complessi possono includere eventi dettagliati (come matrimoni, decessi), fonti (es. registri censuari) e referenze multimediali.

Conclusione

GEDCOM è stato un pilastro nel campo della genealogia, consentendo lo scambio di dati genealogici su diverse piattaforme software. Il suo formato standardizzato ha permesso a ricercatori, storici e appassionati di condividere e preservare i dati della storia familiare in modo efficiente. Tuttavia, nonostante la sua ampia adozione, GEDCOM non è privo di limitazioni. Problemi come la compatibilità tra software, l’incapacità di rappresentare relazioni complesse e la mancanza di supporto per i moderni tipi di dati evidenziano la necessità di continui miglioramenti o soluzioni alternative.

Man mano che la genealogia continua ad evolversi con i progressi della tecnologia, il futuro di GEDCOM potrebbe prevedere aggiornamenti allo standard o lo sviluppo di nuovi formati che meglio si adattino alle complessità della ricerca genealogica moderna. Per ora, GEDCOM rimane uno strumento essenziale per chiunque lavori con alberi genealogici, e comprendere la sua struttura e funzionalità è fondamentale per una gestione e condivisione efficace dei dati nella comunità genealogica.