Dernière mise à jour: 07 fév 2025

Qu’est-ce que GEDCOM ?
GEDCOM (Genealogical Data Communication) est un format de fichier ouvert conçu pour stocker, échanger et partager des données généalogiques (informations sur l’arbre généalogique). Il est largement utilisé dans les logiciels et sites de généalogie, facilitant le transfert de données d’arbre généalogique entre différentes plateformes.

Qui a développé GEDCOM ?
GEDCOM a été créé par L’Église de Jésus-Christ des Saints des Derniers Jours (l’Église LDS), qui gère FamilySearch — une organisation majeure de recherche généalogique. Leur objectif était de simplifier la gestion des données généalogiques et de permettre une meilleure collaboration en recherche.
Comment fonctionne GEDCOM ?
- Les fichiers GEDCOM sont des fichiers texte brut (utilisant maintenant l’encodage UTF-8 à partir de la version 7.0).
- Ils contiennent des informations sur les individus, telles que :
- Noms
- Dates de naissance et de décès
- Relations familiales (parents, enfants, conjoints)
- Événements (mariage, immigration, etc.)
- Ces enregistrements sont liés à l’aide de métadonnées, assurant ainsi les connexions appropriées entre les membres de la famille.
Versions de GEDCOM et normes de l’industrie
- La dernière version officielle est GEDCOM 7.0, publiée en 2021.
- Cependant, GEDCOM 5.5.1 (de 1999, finalisé en 2019)** reste la norme la plus largement utilisée.
- En raison des limitations de GEDCOM 5.5.1, certains développeurs de logiciels de généalogie ont créé des extensions personnalisées comme GEDCOM 5.5 EL (Extended Locations) pour l’améliorer.
Adoption de GEDCOM 7.0
- FamilySearch prévoyait de prendre en charge GEDCOM 7.0 d’ici le 3e trimestre 2022.
- Ancestry.com a également manifesté son intérêt pour son adoption mais n’a pas fourni de date de mise en œuvre ferme.
Pourquoi GEDCOM est-il important ?
- Compatibilité multiplateforme – Permet aux utilisateurs de transférer les données de leur arbre généalogique entre différents sites de généalogie et logiciels.
- Stockage de données à long terme – Assure que les données généalogiques restent accessibles dans un format standardisé.
- Collaboration en généalogie – Permet aux chercheurs et aux historiens de partager et de fusionner les données efficacement.
Explication du modèle de données GEDCOM
GEDCOM utilise un modèle de données lié à la lignée pour organiser les relations familiales de manière structurée. Il est basé sur le concept de famille nucléaire, ce qui signifie qu’il enregistre les relations en termes de parents et enfants plutôt qu’en termes individuels.
Composants clés du modèle de données GEDCOM
Enregistrements INDI (Individu)
- Chaque personne dans le fichier généalogique est stockée en tant qu’enregistrement INDI (individu).
- Chaque individu reçoit un numéro d’identification unique pour garantir un lien correct dans le fichier.
Enregistrements FAM (Famille)
- Les enregistrements familiaux (FAM) servent de structure de liaison entre les individus.
- Un enregistrement FAM assigne :
- HUSB (mari) – Le père dans la famille.
- WIFE (femme) – La mère dans la famille.
- CHIL (enfant) – Les enfants du couple.
- Ces étiquettes sont historiques et basées sur le modèle GEDCOM original mais sont toujours utilisées aujourd’hui.

Évolution de la représentation des genres dans GEDCOM
- Initialement, le modèle GEDCOM a été conçu présumant une structure familiale hétéro-normative, où un homme (HUSB) et une femme (WIFE) ont des enfants (CHIL).
- La spécification GEDCOM 7.0 précise que ces termes n’impliquent pas de rôles de genre ou de parenté biologique.
- La spécification mise à jour permet :
- Les couples de même sexe
- L’adoption, le placement familial et la cohabitation
- Des structures familiales plus flexibles
- Les termes ‘partenaires’, ‘parents’ ou ‘conjoints’ sont désormais préférés lorsqu’on se réfère aux individus dans un enregistrement FAM.

Pourquoi est-ce important ?
- Maintient des relations structurées – Assure que chaque personne est correctement liée aux parents, conjoints et enfants.
- Améliore la compatibilité – Permet aux logiciels de généalogie de reconnaître et d’organiser les données familiales efficacement.
- Augmente l’inclusivité – Prend en charge diverses structures familiales sans supposer de rôles de genre traditionnels.
Explication de la structure d’un fichier GEDCOM
Un fichier GEDCOM se compose de trois sections principales : l’en-tête, les enregistrements, et la remorque. Chaque section joue un rôle spécifique dans l’organisation des données généalogiques, et la structure du fichier est hautement organisée pour garantir que les relations entre les individus et les familles sont claires et standardisées.
1. Section d’en-tête
- La section d’en-tête marque le début du fichier GEDCOM et inclut des métadonnées importantes sur le fichier lui-même, telles que sa version (par exemple, GEDCOM 7.0) et les paramètres ou configurations spéciales du fichier.
- Cette section est représentée par l’enregistrement HEAD.
2. Section des enregistrements
C’est la partie principale du fichier GEDCOM et se compose de plusieurs types d’enregistrements différents, chacun servant un but spécifique :
- INDI (Enregistrement d’individu) : Représente une personne dans l’arbre généalogique.
- FAM (Enregistrement familial) : Représente une famille, liant un mari, une femme, et des enfants.
- SOUR (Enregistrement de source) : Contient des informations sur les sources utilisées pour soutenir les données, telles que des documents historiques.
- OBJE (Enregistrement d’objet) : Représente des objets multimédias, comme des photos ou des documents, associés aux individus ou aux familles.
- NOTE (Enregistrement de note) : Contient des notes ou commentaires supplémentaires pour fournir un contexte ou des explications pour un enregistrement.
- REPO (Enregistrement de dépôt) : Décrit un lieu où des informations généalogiques sont stockées, comme une bibliothèque ou un archive.
- SUBM (Enregistrement de soumissionnaire) : Représente la personne ou l’entité soumettant le fichier GEDCOM.
Chacun de ces enregistrements est structuré hiérarchiquement, avec différents numéros de niveau indiquant comment les données sont liées. Par exemple :
- Niveau 0 est le niveau supérieur pour les enregistrements les plus significatifs, comme HEAD, TRLR, INDI, FAM, SOUR, etc.
- Niveau 1 ou supérieur représente des enregistrements de sous-niveau, comme des événements ou des relations liés à un individu ou une famille spécifique.
3. Section de la Remorque
- La section de la remorque marque la fin du fichier GEDCOM et contient l’enregistrement TRLR. Elle signifie que le fichier est conclu.

Comment cela fonctionne en pratique
Numéros de Niveau : Chaque ligne dans un fichier GEDCOM commence par un numéro de niveau (par ex, 0, 1, 2), où 0 représente les enregistrements de niveau supérieur, et les entiers positifs (1, 2, etc.) représentent les enregistrements imbriqués ou subordonnés. Ce système garantit que les relations et les hiérarchies au sein de l’arbre généalogique sont correctement organisées.
Par exemple :
- Niveau 0 : HEAD (Enregistrement d’en-tête), TRLR (Enregistrement de remorque), INDI (Enregistrement d’Individu)
- Niveau 1 : MARR (Événement de mariage), BIRT (Événement de naissance)
- Niveau 2 : DATE (Date de l’événement), PLAC (Lieu de l’événement)
Écrire à la main un fichier GEDCOM est techniquement possible, mais c’est pas convivial en raison de sa nature structurée. Il est beaucoup plus facile d’utiliser un logiciel conçu pour travailler avec les fichiers GEDCOM, qui aide à organiser et à formater correctement les données.
Validation et Contrôle de la Qualité
- Puisque les fichiers GEDCOM doivent être bien structurés pour une utilisation et un transfert appropriés, il existe des outils pour les valider pour détecter les erreurs.
- PhpGedView Project : Inclut un validateur GEDCOM pour vérifier la structure.
- The Windows GEDCOM Validator : Un outil indépendant pour la validation GEDCOM.
- Gedcheck : L’outil de validation plus ancien, précédemment utilisé par l’Église LDS.
Défis de compatibilité avec GEDCOM
Au début des années 2000, le GEDCOM TestBook Project a évalué la compatibilité des différents logiciels de généalogie avec le standard GEDCOM 5.5. Les résultats ont révélé plusieurs problèmes, tels que des pertes de données ou une lecture incorrecte de la balise NOTE, qui peut apparaître à plusieurs niveaux.
GEDCOM 7.0 vise à résoudre certains de ces problèmes, et des outils de validation pour cette norme plus récente existent pour aider à garantir la compatibilité sur différentes plateformes.
Pourquoi la validation GEDCOM est-elle importante ?
- Elle garantit que les données sont correctement structurées et que les relations entre les individus, les familles, les événements, et les sources sont maintenues proprement.
- Cela aide à éviter la perte de données lors du transfert de fichiers entre programmes de généalogie.
- Cela facilite pour les généalogistes le partage d’informations entre différentes plateformes.
Exemple de fichier GEDCOM
Voici un exemple simple d’un fichier GEDCOM et une explication de sa structure :
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Décomposition et explication :
1. Section d’en-tête (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD : Marque le début du fichier.
- 1 SOUR : Indique la source du fichier (par ex, FamilySearch GEDCOM).
- 2 VERS 7.0 : Spécifie la version du format GEDCOM utilisé (7.0 ici).
- 1 DEST : Indique la destination prévue ou le système pour les données (par ex, Ancestry).
- 1 DATE : La date à laquelle le fichier GEDCOM a été créé (par ex, 5 février 2025).
- 1 SUBM : Pointe vers l’enregistrement du soumissionnaire (@SUBM1@), qui aurait plus d’informations sur la personne soumettant le fichier.
2. Enregistrements Individuels (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@ : Marque le début d’un enregistrement individuel avec une ID unique (@I1@) pour John Doe.
- 1 NAME John /Doe/ : Le nom de l’individu (John Doe).
- 1 SEX M : Genre de l’individu (M pour Masculin).
- 1 BIRT : Indique l’événement de naissance de l’individu.
- 2 DATE 1 JAN 1800 : La date de naissance (1 janvier 1800).
- 2 PLAC New York, USA : Le lieu de naissance (New York, USA).
3. Enregistrement Familial (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@ : Marque le début d’un enregistrement familial avec une ID unique (@F1@).
- 1 HUSB @I1@ : Lie le mari (John Doe, ID @I1@).
- 1 WIFE @I2@ : Lie la femme (Jane Smith, ID @I2@).
- 1 CHIL @I3@ : Lie l’enfant (Mary Doe, ID @I3@).
4. Deuxième Enregistrement Individuel (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@ : Marque le début de l’enregistrement individuel de Jane Smith avec une ID unique (@I2@).
- 1 NAME Jane /Smith/ : Le nom de l’individu (Jane Smith).
- 1 SEX F : Genre de l’individu (F pour Féminin).
- 1 BIRT : Indique l’événement de naissance de l’individu.
- 2 DATE 15 FEB 1805 : La date de naissance (15 février 1805).
- 2 PLAC Boston, USA : Le lieu de naissance (Boston, USA).
5. Troisième Enregistrement Individuel (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@ : Marque le début de l’enregistrement individuel de Mary Doe avec une ID unique (@I3@).
- 1 NAME Mary /Doe/ : Le nom de l’individu (Mary Doe).
- 1 SEX F : Genre de l’individu (F pour Féminin).
- 1 BIRT : Indique l’événement de naissance de l’individu.
- 2 DATE 10 OCT 1825 : La date de naissance (10 octobre 1825).
- 2 PLAC New York, USA : Le lieu de naissance (New York, USA).
6. Section de la Remorque (TRLR)
0 TRLR
- 0 TRLR : Marque la fin du fichier GEDCOM.
Explication des enregistrements clés
- Enregistrements INDI (Individu) : Ils contiennent des détails personnels sur un individu spécifique, comme le nom, le genre, et la date de naissance.
- Enregistrement FAM (Famille) : Celui-ci lie les individus pour former des unités familiales. Il connecte les parents (HUSB et WIFE) et les enfants (CHIL) en utilisant leurs ID uniques.
- Note sur les ID : Chaque enregistrement (individu ou famille) a un identifiant unique qui lui est attribué (par ex,
@I1@
pour John Doe). Ces ID sont utilisés pour lier les enregistrements liés, tels qu’un enfant à ses parents.
Concepts Clés
- Numéros de Niveau : Les fichiers GEDCOM utilisent des numéros de niveau pour organiser les données dans une structure hiérarchique. Niveau 0 est pour les enregistrements de niveau supérieur (comme INDI, FAM), et Niveau 1 et 2 sont utilisés pour les détails de sous-niveau (comme les événements et les lieux).
- Noms entre Barres : Les noms dans GEDCOM sont souvent entourés de barres, tels que John /Doe/, ce qui distingue le nom de famille du prénom.

Il s’agit d’un fichier GEDCOM de base, mais des fichiers plus complexes peuvent inclure des événements détaillés (comme les mariages, les décès), des sources (par ex, des recensements), et des références multimédias.
Conclusion
GEDCOM a été une pierre angulaire dans le domaine de la généalogie, permettant l’échange de données généalogiques à travers différents logiciels et plateformes. Son format standardisé a permis aux chercheurs, historiens, et amateurs de partager et préserver efficacement les données de l’histoire familiale. Cependant, malgré son adoption généralisée, GEDCOM n’est pas sans limitations. Des problèmes tels que la compatibilité entre les logiciels, l’incapacité à représenter des relations complexes, et le manque de support pour les types de données modernes soulignent le besoin d’améliorations continues ou de solutions alternatives.
Alors que la généalogie continue d’évoluer avec les avancées technologiques, l’avenir de GEDCOM pourrait impliquer des mises à jour de la norme ou le développement de nouveaux formats qui mieux accommodent les complexités de la recherche généalogique moderne. Pour le moment, GEDCOM reste un outil essentiel pour quiconque travaille avec des arbres généalogiques, et comprendre sa structure et son fonctionnement est crucial pour une gestion et un partage efficaces des données dans la communauté généalogique.