Última Atualização: 07 Fev, 2025

O que é GEDCOM?
GEDCOM (Genealogical Data Communication) é um formato de arquivo aberto projetado para armazenar, trocar e compartilhar dados genealógicos (informações de árvore genealógica). É amplamente usado em softwares e sites de genealogia, facilitando a transferência de dados de árvores genealógicas entre diferentes plataformas.

Quem Desenvolveu o GEDCOM?
O GEDCOM foi criado pela A Igreja de Jesus Cristo dos Santos dos Últimos Dias (Igreja SUD), que opera o FamilySearch—uma importante organização de pesquisa genealógica. Seu objetivo era simplificar o gerenciamento de dados genealógicos e permitir melhor colaboração em pesquisas.
Como o GEDCOM Funciona?
- Os arquivos GEDCOM são arquivos de texto simples (agora usando a codificação UTF-8 a partir da versão 7.0).
- Eles contêm informações sobre indivíduos, tais como:
- Nomes
- Datas de nascimento e morte
- Relações familiares (pais, filhos, cônjuges)
- Eventos (casamento, imigração, etc.)
- Estes registros são vinculados usando metadados, garantindo conexões adequadas entre os membros da família.
Versões do GEDCOM & Padrões da Indústria
- A última versão oficial é o GEDCOM 7.0, lançado em 2021.
- No entanto, o GEDCOM 5.5.1 (de 1999, finalizado em 2019) **continua sendo o padrão mais amplamente utilizado.
- Porque o GEDCOM 5.5.1 tinha limitações, alguns desenvolvedores de software genealógico criaram extensões personalizadas como GEDCOM 5.5 EL (Localizações Estendidas) para melhorá-lo.
Adoção do GEDCOM 7.0
- O FamilySearch planejava suportar o GEDCOM 7.0 até o 3º trimestre de 2022.
- O Ancestry.com também demonstrou interesse em adotá-lo, mas não forneceu uma data firme de implementação.
Por que o GEDCOM é Importante?
- Compatibilidade Entre Plataformas – Permite aos usuários mover seus dados de árvore genealógica entre diferentes sites e softwares de genealogia.
- Armazenamento de Dados a Longo Prazo – Garante que os dados genealógicos permaneçam acessíveis em um formato padronizado.
- Colaboração em Genealogia – Permite que pesquisadores e historiadores de família compartilhem e fundam dados de forma eficiente.
Explicação do Modelo de Dados do GEDCOM
O GEDCOM usa um modelo de dados vinculado à linhagem para organizar relações familiares de maneira estruturada. Ele é baseado no conceito de família nuclear, o que significa que registra relações em termos de pais e filhos em vez de apenas indivíduos.
Componentes Principais do Modelo de Dados do GEDCOM
Registros INDI (Indivíduo)
- Cada pessoa no arquivo genealógico é armazenada como um registro INDI (indivíduo).
- Cada indivíduo recebe um número de ID único para garantir a vinculação adequada no arquivo.
Registros FAM (Família)
- Registros de família (FAM) servem como a estrutura de ligação entre indivíduos.
- Um registro FAM atribui:
- HUSB (marido) – O pai na família.
- WIFE (esposa) – A mãe na família.
- CHIL (filho) – Os filhos do casal.
- Estes rótulos são históricos e baseados no modelo original do GEDCOM, mas ainda são usados hoje.

Evolução da Representação de Gênero no GEDCOM
- Inicialmente, o modelo GEDCOM foi projetado assumindo uma estrutura de família heteronormativa, onde um homem (HUSB) e uma mulher (WIFE) têm filhos (CHIL).
- A especificação GEDCOM 7.0 esclarece que esses termos não implicam papéis de gênero ou paternidade biológica.
- A especificação atualizada permite:
- Casais do mesmo sexo
- Adoção, acolhimento e coabitação
- Estruturas familiares mais flexíveis
- Os termos ‘parceiros’, ‘pais’ ou ‘cônjuges’ são agora preferidos ao se referir a indivíduos em um registro FAM.

Por que Isso é Importante?
- Mantém Relações Estruturadas – Garante que cada pessoa esteja corretamente vinculada a pais, cônjuges e filhos.
- Melhora a Compatibilidade – Permite que o software de genealogia reconheça e organize os dados familiares de maneira eficiente.
- Aumenta a Inclusividade – Suporta estruturas familiares diversas sem assumir papéis de gênero tradicionais.
Explicação da Estrutura de um Arquivo GEDCOM
Um arquivo GEDCOM consiste em três seções principais: o cabeçalho, os registros e o rodapé. Cada seção desempenha um papel específico na organização dos dados genealógicos, e a estrutura do arquivo é altamente organizada para garantir que as relações entre indivíduos e famílias sejam claras e padronizadas.
1. Seção de Cabeçalho
- A seção de cabeçalho marca o início do arquivo GEDCOM e inclui metadados importantes sobre o próprio arquivo, como sua versão (por exemplo, GEDCOM 7.0) e quaisquer configurações ou configurações especiais para o arquivo.
- Esta seção é representada pelo registro HEAD.
2. Seção de Registros
Esta é a parte principal do arquivo GEDCOM e consiste em vários tipos de registros diferentes, cada um servindo a um propósito específico:
- INDI (Registro de Indivíduo): Representa uma pessoa individual na árvore genealógica.
- FAM (Registro de Família): Representa uma família, ligando um marido, esposa e filhos.
- SOUR (Registro de Fonte): Contém informações sobre as fontes usadas para apoiar os dados, como registros históricos.
- OBJE (Registro de Objeto): Representa objetos multimídia, como fotos ou documentos, associados a indivíduos ou famílias.
- NOTE (Registro de Nota): Contém notas ou comentários adicionais que podem fornecer contexto ou explicações extras para um registro.
- REPO (Registro de Repositório): Descreve um local onde as informações genealógicas são armazenadas, como uma biblioteca ou arquivo.
- SUBM (Registro do Submetedor): Representa a pessoa ou entidade que enviou o arquivo GEDCOM.
Cada um desses registros é estruturado hierarquicamente, com diferentes números de nível indicando como os dados estão relacionados. Por exemplo:
- Nível 0 é o nível superior para os registros mais significativos, como HEAD, TRLR, INDI, FAM, SOUR, etc.
- Nível 1 ou superior representa registros em subníveis, como eventos ou relações vinculadas a um indivíduo ou família específica.
3. Seção de Rodapé
- A seção de rodapé marca o fim do arquivo GEDCOM e contém o registro TRLR. Ela indica que o arquivo foi concluído.

Como Funciona na Prática
Números de Nível: Cada linha em um arquivo GEDCOM começa com um número de nível (por exemplo, 0, 1, 2), onde 0 representa os registros de nível superior, e números inteiros positivos (1, 2, etc.) representam registros aninhados ou subordinados. Este sistema garante que as relações e hierarquias dentro da árvore genealógica estejam organizadas adequadamente.
Por exemplo:
- Nível 0: HEAD (Registro de Cabeçalho), TRLR (Registro de Rodapé), INDI (Registro Individual)
- Nível 1: MARR (Evento de Casamento), BIRT (Evento de Nascimento)
- Nível 2: DATE (Data do evento), PLAC (Local do evento)
Escrever um arquivo GEDCOM à mão é tecnicamente possível, mas não é amigável para o usuário devido à sua natureza estruturada. É muito mais fácil usar software projetado para trabalhar com arquivos GEDCOM, que ajuda a organizar e formatar os dados corretamente.
Validação e Controle de Qualidade
- Como os arquivos GEDCOM precisam ser bem estruturados para uso e transferência adequados, existem ferramentas para validá-los quanto a erros.
- Projeto PhpGedView: Inclui um validador GEDCOM para verificar a estrutura.
- O Validador de GEDCOM para Windows: Uma ferramenta independente para validação de GEDCOM.
- Gedcheck: A antiga ferramenta de validação, anteriormente usada pela Igreja SUD.
Desafios com a Compatibilidade do GEDCOM
No início dos anos 2000, o Projeto GEDCOM TestBook avaliou o quão bem diferentes softwares de genealogia cumpriam o padrão GEDCOM 5.5. Os resultados revelaram vários problemas, como perda de dados ou leitura incorreta da etiqueta NOTE, que pode aparecer em vários níveis.
O GEDCOM 7.0 visa resolver alguns desses problemas, e há ferramentas de validação disponíveis para tal.
GEDCOM 7.0 busca resolver alguns desses problemas, e ferramentas de validação estão disponíveis para verificar sua conformidade.
Por que é Importante?
Garante que cada pessoa esteja corretamente vinculada a pais, cônjuges e filhos.
Composição segrega dados em camadas hierárquicas por níveis de detalhes, garantindo que as informações sejam estruturadas corretamente.
Análise de Qualidade e Validação: A correta estruturação de arquivos GEDCOM precisa de validação de possíveis erros para garantir a transferência perfeita entre programas de genealogia.
INDI (Registros Individuais): Estes contêm detalhes pessoais sobre um indivíduo específico, como nome, gênero e data de nascimento.
FAM (Registro de Família): Estes registros contêm registros ligados a um casal de marido, mulher e filhos associados por seus IDs únicos.
Esta é uma estrutura base de um arquivo GEDCOM, mas arquivos mais complexos podem incluir eventos detalhados (como casamentos, falecimentos), fontes (por exemplo, registros históricos), etc.
Exemplo de Arquivo GEDCOM
Aqui está um exemplo simples de um arquivo GEDCOM e uma explicação de sua estrutura:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Explicação dos Detalhes:
1. Seção de Cabeçalho (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: Marca o início do arquivo GEDCOM e contém metadados gerais sobre o arquivo.
- 1 SOUR: Fonte do arquivo (FamilySearch GEDCOM).
- 2 VERS 7.0: Especifica a versão do formato GEDCOM usado (7.0 aqui).
- 1 DEST: Indica o destino ou sistema pretendido para os dados (por exemplo, Ancestry).
- 1 DATE: A data de criação do arquivo GEDCOM (por exemplo, 5 de fevereiro de 2025).
- 1 SUBM: Aponta para o registro do remetente (@SUBM1@), que teria mais informações sobre a pessoa que submeteu o arquivo.
2. Registros Individuais (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: Marca o início de um registro individual com uma ID única (@I1@) para John Doe.
- 1 NAME John /Doe/: Nome completo do indivíduo (John Doe).
- 1 SEX M: Gênero do indivíduo (M para Masculino).
- 1 BIRT: Indica o evento de nascimento do indivíduo.
- 2 DATE 1 JAN 1800: A data de nascimento (1 de janeiro de 1800).
- 2 PLAC New York, USA: O local de nascimento (New York, USA).
3. Registro de Família (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: Marca o início de um registro de família com uma ID única (@F1@) para uma família.
- 1 HUSB @I1@: Liga o marido (John Doe, ID @I1@).
- 1 WIFE @I2@: Liga a esposa (Jane Smith, ID @I2@).
- 1 CHIL @I3@: Liga o filho (Mary Doe, ID @I3@).
4. Segundo Registro Individual (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: Marca o início do registro individual de Jane Smith com uma ID única (@I2@).
- 1 NAME Jane /Smith/: Nome da indivíduo (Jane Smith).
- 1 SEX F: Gênero da indivíduo (F para Feminino).
- 1 BIRT: Indica o evento de nascimento da indivíduo.
- 2 DATE 15 FEB 1805: A data de nascimento (15 de fevereiro de 1805).
- 2 PLAC Boston, USA: O local de nascimento (Boston, USA).
5. Terceiro Registro Individual (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: Marca o início do registro individual de Mary Doe com uma ID única (@I3@).
- 1 NAME Mary /Doe/: Nome da indivíduo (Mary Doe).
- 1 SEX F: Gênero da indivíduo (F para Feminino).
- 1 BIRT: Indica o evento de nascimento da indivíduo.
- 2 DATE 10 OCT 1825: A data de nascimento (10 de outubro de 1825).
- 2 PLAC New York, USA: O local de nascimento (New York, USA).
5. Seção de Rodapé (TRLR)
0 TRLR
- 0 TRLR: Marca o final do arquivo GEDCOM.
Explicação dos Registros-Chave
- Registros INDI (Individuais): Estes contêm detalhes pessoais sobre um indivíduo específico, como nome, gênero e data de nascimento.
- Registro FAM (Família): Este vincula indivíduos para formar unidades familiares. Ele conecta pais (HUSB e WIFE) e filhos (CHIL) usando suas IDs únicas.
- Nota sobre IDs: Cada registro (individual ou familiar) tem uma ID única atribuída a ele (por exemplo,
@I1@
para John Doe). Esses IDs são usados para vincular registros relacionados, como vincular um filho a seus pais.
Conceitos-Chave
- Números de Nível: Os arquivos GEDCOM usam números de nível para organizar dados de maneira hierárquica. Nível 0 é para registros de nível superior (como INDI, FAM), e Níveis 1 e 2 são usados para detalhes de subnível (como eventos e locais).
- Nomes em barras: Os nomes no GEDCOM geralmente estão entre barras, como John /Doe/, que diferencia o sobrenome do nome próprio.

Este é um arquivo GEDCOM básico, mas arquivos mais complexos podem incluir eventos detalhados (como casamentos, óbitos), fontes (por exemplo, registros censitários), e referências multimídia.
Conclusão
O GEDCOM tem sido um pilar no campo da genealogia, possibilitando a troca de dados genealógicos entre diferentes plataformas de software. Seu formato padronizado permite que pesquisadores, historiadores e amadores compartilhem e preservem dados de história familiar de maneira eficiente. No entanto, apesar de sua ampla adoção, o GEDCOM não está isento de limitações. Questões como compatibilidade entre softwares, a incapacidade de representar relações complexas e a falta de suporte para tipos de dados modernos destacam a necessidade contínua de melhorias ou soluções alternativas.
À medida que a genealogia continua a evoluir com os avanços da tecnologia, o futuro do GEDCOM pode envolver atualizações no padrão ou o desenvolvimento de novos formatos que acomodem melhor as complexidades da pesquisa genealógica moderna.