Última Actualización: 07 Feb, 2025

Título - Formato de Archivo GEDCOM y FamilySearch

¿Qué es GEDCOM?

GEDCOM (Comunicación de Datos Genealógicos) es un formato de archivo abierto diseñado para almacenar, intercambiar y compartir datos genealógicos (información de árboles genealógicos). Es ampliamente utilizado en software y sitios web de genealogía, facilitando la transferencia de datos de árboles genealógicos entre diferentes plataformas.

Ilustración - Formato de Archivo GEDCOM y FamilySearch

¿Quién Desarrolló GEDCOM?

GEDCOM fue creado por La Iglesia de Jesucristo de los Santos de los Últimos Días (Iglesia SUD), que opera FamilySearch, una importante organización de investigación genealógica. Su objetivo era simplificar la gestión de datos genealógicos y mejorar la colaboración en la investigación.

¿Cómo Funciona GEDCOM?

  • Los archivos GEDCOM son archivos de texto simple (ahora utilizando codificación UTF-8 desde la versión 7.0).
  • Contienen información sobre individuos, como:
    • Nombres
    • Fechas de nacimiento y muerte
    • Relaciones familiares (padres, hijos, cónyuges)
    • Eventos (matrimonio, inmigración, etc.)
  • Estos registros están vinculados usando metadatos, asegurando conexiones correctas entre miembros de la familia.

Versiones de GEDCOM y Estándares de la Industria

  • La última versión oficial es GEDCOM 7.0, lanzada en 2021.
  • Sin embargo, GEDCOM 5.5.1 (de 1999, finalizada en 2019) sigue siendo el estándar más utilizado.
  • Debido a las limitaciones de GEDCOM 5.5.1, algunos desarrolladores de software genealógico crearon extensiones personalizadas como GEDCOM 5.5 EL (Localizaciones Extendidas) para mejorarlo.

Adopción de GEDCOM 7.0

  • FamilySearch planeaba soportar GEDCOM 7.0 para el tercer trimestre de 2022.
  • Ancestry.com también ha mostrado interés en adoptarlo, pero no ha proporcionado una fecha concreta de implementación.

¿Por qué es Importante GEDCOM?

  1. Compatibilidad entre Plataformas – Permite a los usuarios mover sus datos de árboles genealógicos entre diferentes sitios web y software de genealogía.
  2. Almacenamiento de Datos a Largo Plazo – Asegura que los datos genealógicos permanezcan accesibles en un formato estandarizado.
  3. Colaboración Genealógica – Permite que investigadores e historiadores familiares compartan y unan datos de manera eficiente.

Explicación del Modelo de Datos GEDCOM

GEDCOM utiliza un modelo de datos vinculados de linaje para organizar relaciones familiares de manera estructurada. Está basado en el concepto de familia nuclear, es decir, registra relaciones en términos de padres e hijos en lugar de solo individuos.

Componentes Clave del Modelo de Datos GEDCOM

  1. Registros INDI (Individuales)

    • Cada persona en el archivo genealógico se almacena como un registro INDI (individual).
    • A cada individuo se le asigna un número de identificación único para asegurar vínculos correctos en el archivo.
  2. Registros FAM (Familiares)

    • Los registros familiares (FAM) sirven como la estructura de vinculación entre individuos.
    • Un registro FAM asigna:
      • HUSB (esposo): El padre en la familia.
      • WIFE (esposa): La madre en la familia.
      • CHIL (hijo): Los hijos de la pareja.
    • Estas etiquetas son históricas y se basan en el modelo GEDCOM original, pero todavía se utilizan hoy.
Ilustración - Explicación del Modelo de Datos GEDCOM

Evolución de la Representación de Género en GEDCOM

  • Inicialmente, el modelo GEDCOM fue diseñado asumiendo una estructura familiar heteronormativa, donde un hombre (HUSB) y una mujer (WIFE) tienen hijos (CHIL).
  • La especificación de GEDCOM 7.0 aclara que estos términos no implican roles de género ni paternidad biológica.
  • La especificación actualizada permite:
    • Parejas del mismo sexo
    • Adopción, acogida y convivencia
    • Estructuras familiares más flexibles
  • Ahora se prefieren los términos ‘parejas’, ‘padres’ o ‘cónyuges’ al referirse a individuos en un registro FAM.
Ilustración - Explicación del Modelo de Datos GEDCOM

¿Por qué Es Esto Importante?

  1. Mantiene las Relaciones Estructuradas – Asegura que cada persona esté correctamente vinculada a padres, cónyuges e hijos.
  2. Mejora la Compatibilidad – Permite que el software de genealogía reconozca y organice datos familiares eficientemente.
  3. Aumenta la Inclusividad – Soporta diversas estructuras familiares sin asumir roles de género tradicionales.

Explicación de la Estructura de un Archivo GEDCOM

Un archivo GEDCOM consta de tres secciones principales: el encabezado, los registros y el tráiler. Cada sección cumple un papel específico en la organización de los datos genealógicos, y la estructura del archivo está altamente organizada para asegurar que las relaciones entre individuos y familias sean claras y estandarizadas.

1. Sección de Encabezado

  • La sección de encabezado marca el inicio del archivo GEDCOM e incluye metadatos importantes sobre el archivo en sí, como su versión (por ejemplo, GEDCOM 7.0) y cualquier configuración o ajuste especial.
  • Esta sección está representada por el registro HEAD.

2. Sección de Registros

Esta es la parte principal del archivo GEDCOM y consta de varios tipos de registros diferentes, cada uno con un propósito específico:

  • INDI (Registro Individual): Representa a una persona en el árbol genealógico.
  • FAM (Registro Familiar): Representa a una familia, vinculando a un esposo, una esposa y los hijos.
  • SOUR (Registro de Fuente): Contiene información sobre las fuentes utilizadas para respaldar los datos, como registros históricos.
  • OBJE (Registro de Objeto): Representa objetos multimedia, como fotos o documentos, asociados con individuos o familias.
  • NOTE (Registro de Nota): Contiene notas o comentarios adicionales que pueden proporcionar un contexto adicional o explicaciones para un registro.
  • REPO (Registro de Repositorio): Describe un lugar donde se almacena la información genealógica, como una biblioteca o un archivo.
  • SUBM (Registro de Remitente): Representa a la persona o entidad que envía el archivo GEDCOM.

Cada uno de estos registros está estructurado jerárquicamente, con diferentes números de nivel que indican cómo se relacionan los datos. Por ejemplo:

  • El Nivel 0 es el nivel superior para los registros más importantes, como HEAD, TRLR, INDI, FAM, SOUR, etc.
  • Nivel 1 o superior representa registros de subnivel, como eventos o relaciones vinculadas a un individuo o familia específica.

3. Sección de Tráiler

  • La sección de tráiler marca el final del archivo GEDCOM y contiene el registro TRLR. Indica que el archivo ha concluido.
Ilustración - Explicación de la Estructura de un Archivo GEDCOM

Cómo Funciona en la Práctica

  • Números de Nivel: Cada línea en un archivo GEDCOM comienza con un número de nivel (por ejemplo, 0, 1, 2), donde 0 representa registros de nivel superior, y los enteros positivos (1, 2, etc.) representan registros anidados o subordinados. Este sistema asegura que las relaciones y jerarquías dentro del árbol genealógico estén organizadas correctamente.

    Por ejemplo:

    • Nivel 0: HEAD (Registro de Encabezado), TRLR (Registro de Tráiler), INDI (Registro Individual)
    • Nivel 1: MARR (Evento de Matrimonio), BIRT (Evento de Nacimiento)
    • Nivel 2: DATE (Fecha del evento), PLAC (Lugar del evento)
  • Escribir un archivo GEDCOM a mano es técnicamente posible, pero no es amigable para humanos debido a su naturaleza estructurada. Es mucho más fácil usar software diseñado para trabajar con archivos GEDCOM, que ayuda a organizar y formatear correctamente los datos.

Validación y Control de Calidad

  • Dado que los archivos GEDCOM deben estar bien estructurados para su correcto uso y transferencia, existen herramientas para validarlos en busca de errores.
    • Proyecto PhpGedView: Incluye un validador GEDCOM para verificar la estructura.
    • El Validador GEDCOM de Windows: Una herramienta independiente para la validación de GEDCOM.
    • Gedcheck: La herramienta de validación más antigua, utilizada anteriormente por la Iglesia SUD.

Desafíos con la Compatibilidad de GEDCOM

  • A principios de la década de 2000, el Proyecto de Libro de Pruebas de GEDCOM evaluó qué tan bien diferentes software de genealogía cumplían con el estándar GEDCOM 5.5. Los resultados revelaron varios problemas, como la pérdida de datos o una lectura inadecuada de la etiqueta NOTE, que puede aparecer en múltiples niveles.

  • GEDCOM 7.0 pretende abordar algunos de estos problemas, y existen herramientas de validación para esta nueva versión.

Por Qué Es Esto Importante

  • Mantiene las Relaciones Estructuradas – Asegura que cada persona esté correctamente vinculada a padres, cónyuges e hijos.
  • Mejora la Compatibilidad – Permite que el software de genealogía reconozca y organice datos familiares eficientemente.
  • Aumenta la Inclusividad – Apoya estructuras familiares diversas sin asumir roles de género tradicionales.

Ejemplo de Archivo GEDCOM

Aquí tienes un ejemplo simple de un archivo GEDCOM y una explicación de su estructura:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 TRLR

Desglose y Explicación:

1. Sección de Encabezado (HEAD)

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
  • 0 HEAD: Marca el inicio del archivo e incluye metadatos importantes sobre el archivo mismo, como su versión (por ejemplo, GEDCOM 7.0) y cualquier configuración o ajuste especial.
  • Esta sección está representada por el registro HEAD.

2. Registro Individual (INDI)

0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
  • 0 INDI @I1@: Marca el inicio de un registro individual con un ID único (@I1@) para John Doe.
  • 1 NAME John /Doe/: El nombre del individuo (John Doe).
  • 1 SEX M: Género del individuo (M para Masculino).
  • 1 BIRT: Indica el evento de nacimiento del individuo.
    • 2 DATE 1 JAN 1800: La fecha de nacimiento (1 de enero de 1800).
    • 2 PLAC New York, USA: El lugar de nacimiento (New York, EE.UU.).

3. Registro Familiar (FAM)

0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
  • 0 FAM @F1@: Marca el inicio de un registro de familia con un ID único (@F1@).
  • 1 HUSB @I1@: Vincula al esposo (John Doe, ID @I1@).
  • 1 WIFE @I2@: Vincula a la esposa (Jane Smith, ID @I2@).
  • 1 CHIL @I3@: Vincula al hijo (Mary Doe, ID @I3@).

3. Segundo Registro Individual (INDI)

0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
  • 0 INDI @I2@: Marca el inicio del registro individual de Jane Smith con un ID único (@I2@).
  • 1 NAME Jane /Smith/: El nombre del individuo (Jane Smith).
  • 1 SEX F: Género del individuo (F para Femenino).
  • 1 BIRT: Indica el evento de nacimiento del individuo.
    • 2 DATE 15 FEB 1805: La fecha de nacimiento (15 de febrero de 1805).
    • 2 PLAC Boston, USA: El lugar de nacimiento (Boston, EE.UU.).

5. Tercer Registro Individual (INDI)

0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
  • 0 INDI @I3@: Marca el inicio del registro individual de Mary Doe con un ID único (@I3@).
  • 1 NAME Mary /Doe/: El nombre del individuo (Mary Doe).
  • 1 SEX F: Género del individuo (F para Femenino).
  • 1 BIRT: Indica el evento de nacimiento del individuo.
    • 2 DATE 10 OCT 1825: La fecha de nacimiento (10 de octubre de 1825).
    • 2 PLAC New York, USA: El lugar de nacimiento (Nueva York, EE.UU.).

6. Sección de Tráiler (TRLR)

0 TRLR
  • 0 TRLR: Marca el final del archivo GEDCOM.

Explicación de los Registros Clave

  • Registros INDI (Individuales): Contienen detalles personales sobre un individuo específico, como nombre, género y fecha de nacimiento.
  • Registro FAM (Familiar): Vincula individuos para formar unidades familiares. Conecta padres (HUSB y WIFE) e hijos (CHIL) usando sus ID únicos.
  • Nota sobre los ID: Cada registro (individual o familiar) tiene un ID único asignado (por ejemplo, @I1@ para John Doe). Estos IDs se utilizan para vincular registros relacionados, como vincular un hijo con sus padres.

Conceptos Clave

  • Números de Nivel: Los archivos GEDCOM utilizan números de nivel para organizar datos en una estructura jerárquica. Nivel 0 es para registros de nivel superior (como INDI, FAM), y Nivel 1 y 2 se utilizan para detalles de subnivel (como eventos y lugares).
  • Nombres entre barras: Los nombres en GEDCOM a menudo están entre barras, como John /Doe/, lo que diferencia el apellido del nombre de pila.
Ilustración - GEDCOM - Explicación de los Registros Clave

Este es un archivo GEDCOM básico, pero los archivos más complejos pueden incluir eventos detallados (como matrimonios, defunciones), fuentes (por ejemplo, registros censales) y referencias multimedia.

Conclusión

GEDCOM ha sido un pilar en el campo de la genealogía, permitiendo el intercambio de datos genealógicos entre diferentes plataformas de software. Su formato estandarizado ha permitido a investigadores, historiadores y aficionados compartir y preservar datos de historia familiar de manera eficiente. Sin embargo, a pesar de su amplia adopción, GEDCOM no está exento de limitaciones. Problemas como la compatibilidad entre software, la incapacidad para representar relaciones complejas y la falta de soporte para tipos de datos modernos destacan la necesidad de mejoras continuas o soluciones alternativas.

A medida que la genealogía continúa evolucionando con los avances en tecnología, el futuro de GEDCOM puede involucrar actualizaciones del estándar o el desarrollo de nuevos formatos que se adapten mejor a las complejidades de la investigación genealógica moderna. Por ahora, GEDCOM sigue siendo una herramienta esencial para cualquier persona que trabaje con árboles genealógicos, y comprender su estructura y funcionalidad es crucial para una administración y compartición de datos efectivas en la comunidad genealógica.