Последнее обновление: 07 февраля 2025 года

Что такое GEDCOM?
GEDCOM (Genealogical Data Communication) — это открытый формат файлов, предназначенный для хранения, обмена и передачи генеалогических данных (информации о генеалогическом древе). Он широко используется в генеалогическом программном обеспечении и на веб-сайтах, упрощая перенос данных о генеалогическом древе между различными платформами.

Кто разработал GEDCOM?
GEDCOM был создан Церковью Иисуса Христа Святых последних дней (Церковь СПД), которая управляет FamilySearch — крупнейшей организацией по генеалогическим исследованиям. Их цель состояла в упрощении управления генеалогическими данными и обеспечении лучшего сотрудничества в исследованиях.
Как работает GEDCOM?
- Файлы GEDCOM представляют собой текстовые файлы (теперь используют кодировку UTF-8 с версии 7.0).
- Они содержат информацию об отдельных личностях, такую как:
- Имена
- Даты рождения и смерти
- Семейные отношения (родители, дети, супруги)
- События (брак, иммиграция и т.д.)
- Эти записи связываются с помощью метаданных, обеспечивая правильные связи между членами семьи.
Версии GEDCOM и отраслевые стандарты
- Последняя официальная версия — GEDCOM 7.0, выпущенная в 2021 году.
- Однако GEDCOM 5.5.1 (с 1999 года, окончательно в 2019 году) остается самым широко используемым стандартом.
- Поскольку GEDCOM 5.5.1 имел ограничения, некоторые разработчики генеалогического ПО создали пользовательские расширения, такие как GEDCOM 5.5 EL (Extended Locations), для его улучшения.
Принятие GEDCOM 7.0
- FamilySearch планировал поддержать GEDCOM 7.0 к третьему кварталу 2022 года.
- Ancestry.com также проявил интерес к его принятию, но не предоставил точных сроков внедрения.
Почему GEDCOM важен?
- Кроссплатформенная совместимость – Позволяет пользователям переносить свои данные о генеалогическом древе между различными веб-сайтами и программным обеспечением.
- Долгосрочное хранение данных – Обеспечивает доступность генеалогических данных в стандартизированном формате.
- Сотрудничество в генеалогии – Позволяет исследователям и семейным историкам эффективно делиться и объединять данные.
Объяснение модели данных GEDCOM
GEDCOM использует модель данных, основанную на родстве, для организации семейных отношений структурированным образом. Это основано на понятии нуклеарной семьи, что означает, что оно регистрирует отношения в терминах родителей и детей, а не просто индивидуумов.
Ключевые компоненты модели данных GEDCOM
INDI (Индивидуальные) записи
- Каждый человек в генеалогическом файле хранится в виде INDI (индивидуальной) записи.
- Каждому индивиду назначается уникальный идентификационный номер для обеспечения правильного связывания в файле.
FAM (Семейные) записи
- Семейные записи (FAM) служат структурой связывания между индивидуумами.
- Запись FAM назначает:
- HUSB (муж) – Отец в семье.
- WIFE (жена) – Мать в семье.
- CHIL (ребенок) – Дети пары.
- Эти обозначения исторические и основаны на оригинальной модели GEDCOM, но все еще используются сегодня.

Эволюция представления гендера в GEDCOM
- Изначально модель GEDCOM была разработана с предположением гетеронормативной структуры семьи, где мужчина (HUSB) и женщина (WIFE) имеют детей (CHIL).
- Спецификация GEDCOM 7.0 уточняет, что эти термины не подразумевают гендерные роли или биологическое родительство.
- Обновленная спецификация позволяет:
- Парам одного пола
- Усыновлению, опекунству и сожительству
- Более гибким структурам семей
- Теперь предпочтительны термины ‘партнеры’, ‘родители’ или ‘супруги’ при упоминании личности в записи FAM.

Почему это важно?
- Поддержание структурированных отношений – Обеспечивает правильное связывание каждого человека с родителями, супругами и детьми.
- Улучшение совместимости – Позволяет генеалогическому программному обеспечению узнавать и организовывать семейные данные эффективно.
- Увеличение инклюзивности – Поддерживает разнообразные семейные структуры, не предполагая традиционных гендерных ролей.
Объяснение структуры файла GEDCOM
Файл GEDCOM состоит из трех основных разделов: заголовка, записей и концовки. Каждый раздел играет определенную роль в организации генеалогических данных, и структура файла сильно упорядочена, чтобы обеспечить ясность и стандартизацию отношений между людьми и семьями.
1. Раздел Заголовка
- Заголовок — это начало файла GEDCOM и включает важные метаданные о самом файле, такие как его версия (например, GEDCOM 7.0) и любые специальные настройки или конфигурации для файла.
- Этот раздел представлен записью HEAD.
2. Раздел записей
Это основная часть файла GEDCOM и состоит из нескольких разных типов записей, каждая из которых служит определенной цели:
- INDI (Индивидуальная запись): Представляет отдельного человека в генеалогическом древе.
- FAM (Семейная запись): Представляет семью, связывая мужа, жену и детей.
- SOUR (Запись источника): Содержит информацию об источниках, использованных для поддержки данных, таких как исторические записи.
- OBJE (Запись объекта): Представляет мультимедийные объекты, такие как фотографии или документы, связанные с лицами или семьями.
- NOTE (Запись примечания): Содержит дополнительные примечания или комментарии, которые могут предоставить дополнительный контекст или объяснения для записи.
- REPO (Запись хранилища): Описывает место, где хранятся генеалогические данные, например, библиотеку или архив.
- SUBM (Запись отправителя): Представляет человека или организацию, подающую файл GEDCOM.
Каждая из этих записей структурирована иерархически, с разными уровневыми номерами, указывающими, как данные связаны. Например:
- Уровень 0 — это основной уровень для наиболее значительных записей, такие как HEAD, TRLR, INDI, FAM, SOUR и другие.
- Уровень 1 и выше представляет подуровневые записи, такие как события или отношения, связанные с конкретным человеком или семьей.
3. Раздел концовки
- Раздел концовки обозначает конец файла GEDCOM и содержит запись TRLR. Это означает, что файл завершен.

Как это работает на практике
Уровневые номера: Каждая строка в файле GEDCOM начинается с номера уровня (например, 0, 1, 2), где 0 представляет записи высшего уровня, а положительные целые числа (1, 2 и т.д.) представляют вложенные или подчиненные записи. Эта система гарантирует, что отношения и иерархии в генеалогическом древе правильно организованы.
Например:
- Уровень 0: HEAD (Запись заголовка), TRLR (Запись концовки), INDI (Индивидуальная запись)
- Уровень 1: MARR (Событие брака), BIRT (Событие рождения)
- Уровень 2: DATE (Дата события), PLAC (Место события)
Написание файла GEDCOM вручную технически возможно, но это неудобно для человека из-за его структурированной природы. Гораздо проще использовать программное обеспечение, предназначенное для работы с файлами GEDCOM, которое помогает правильно организовать и форматировать данные.
Валидация и контроль качества
- Поскольку файлы GEDCOM должны быть хорошо структурированы для правильного использования и передачи, существуют инструменты для их проверки на ошибки.
- Проект PhpGedView: включает валидатор GEDCOM для проверки структуры.
- Валидатор GEDCOM для Windows: автономный инструмент для валидации GEDCOM.
- Gedcheck: старый инструмент валидации, ранее использованный Церковью СПД.
Проблемы совместимости GEDCOM
В начале 2000-х Проект GEDCOM TestBook оценил, насколько хорошо различные генеалогические программы соответствуют стандарту GEDCOM 5.5. Результаты выявили несколько проблем, таких как потеря данных или неправильное чтение тега NOTE, который может появляться на нескольких уровнях.
GEDCOM 7.0 стремится решить некоторые из этих проблем, и инструменты валидации для этого нового стандарта существуют для обеспечения совместимости на разных платформах.
Почему валидация GEDCOM важна?
- Гарантирует, что данные структурированы правильно, а отношения между людьми, семьями, событиями и источниками поддерживаются исключительно.
- Помогает избежать потери данных при передаче файлов между генеалогическими программами.
- Позволяет генеалогам делиться информацией на разных платформах.
Пример файла GEDCOM
Вот простой пример файла GEDCOM и объяснение его структуры:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Разбор и объяснение:
1. Раздел Заголовка (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: Обозначает начало файла.
- 1 SOUR: Указывает источник файла (например, FamilySearch GEDCOM).
- 2 VERS 7.0: Указывает версию формата GEDCOM, используемую здесь (7.0).
- 1 DEST: Указывает целевую аудиторию или систему для данных (например, Ancestry).
- 1 DATE: Дата создания файла GEDCOM (например, 5 февраля 2025 года).
- 1 SUBM: Указывает на запись отправителя (@SUBM1@), которая будет содержать дополнительную информацию о лице, подающем файл.
2. Индивидуальные записи (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: Обозначает начало записи о человеке с уникальным идентификатором (@I1@) для Джона Доу.
- 1 NAME John /Doe/: Имя человека (Джон Доу).
- 1 SEX M: Пол человека (М для Мужчина).
- 1 BIRT: Указывает событие рождения человека.
- 2 DATE 1 JAN 1800: Дата рождения (1 января 1800 года).
- 2 PLAC New York, USA: Место рождения (Нью-Йорк, США).
3. Семейная запись (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: Обозначает начало записи о семье с уникальным идентификатором (@F1@).
- 1 HUSB @I1@: Ссылается на мужа (Джон Доу, ID @I1@).
- 1 WIFE @I2@: Ссылается на жену (Джейн Смит, ID @I2@).
- 1 CHIL @I3@: Ссылается на ребенка (Мэри Доу, ID @I3@).
4. Вторая индивидуальная запись (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: Обозначает начало записи Джейн Смит с уникальным идентификатором (@I2@).
- 1 NAME Jane /Smith/: Имя человека (Джейн Смит).
- 1 SEX F: Пол человека (Ж для Женщина).
- 1 BIRT: Указывает событие рождения человека.
- 2 DATE 15 FEB 1805: Дата рождения (15 февраля 1805 года).
- 2 PLAC Boston, USA: Место рождения (Бостон, США).
5. Третья индивидуальная запись (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: Обозначает начало записи Мэри Доу с уникальным идентификатором (@I3@).
- 1 NAME Mary /Doe/: Имя человека (Мэри Доу).
- 1 SEX F: Пол человека (Ж для Женщина).
- 1 BIRT: Указывает событие рождения человека.
- 2 DATE 10 OCT 1825: Дата рождения (10 октября 1825 года).
- 2 PLAC New York, USA: Место рождения (Нью-Йорк, США).
6. Раздел концовки (TRLR)
0 TRLR
- 0 TRLR: Обозначает конец файла GEDCOM.
Объяснение ключевых записей
- INDI (Индивидуальные) записи: Содержат личные данные о конкретном человеке, такие как имя, пол и дата рождения.
- FAM (Семейная) запись: Связывает людей для формирования семейных единиц. Связывает родителей (HUSB и WIFE) и детей (CHIL), используя их уникальные идентификаторы.
- Заметка о идентификаторах: Каждая запись (индивидуальная или семейная) имеет уникальный идентификатор, присвоенный ей (например,
@I1@
для Джона Доу). Эти идентификаторы используются для связывания связанных записей, таких как связывание ребенка с их родителями.
Ключевые концепции
- Уровневые номера: Файлы GEDCOM используют уровневые номера для организации данных в иерархической структуре. Уровень 0 предназначен для записей верхнего уровня (таких как INDI, FAM), а уровень 1 и 2 используются для подробностей подуровня (таких как события и места).
- Имена в косых чертах: Имена в GEDCOM часто заключены в косые черты, например John /Doe/, что различает фамилию от имени.

Это базовый файл GEDCOM, но более сложные файлы могут включать подробные события (такие как браки, смерти), источники (например, переписные записи) и мультимедийные справки.
Заключение
GEDCOM был краеугольным камнем в области генеалогии, позволяя обмениваться генеалогическими данными на различных программных платформах. Его стандартизированный формат позволил исследователям, историкам и любителям эффективно делиться и сохранять данные семейной истории. Однако, несмотря на широкое распространение, GEDCOM не лишен ограничений. Проблемы, такие как совместимость между программами, невозможность представления сложных отношений и недостаток поддержки современных типов данных, подчеркивают необходимость текущих улучшений или альтернативных решений.
По мере того как генеалогия продолжает развиваться с развитием технологий, будущее GEDCOM может включать обновления стандарта или разработку новых форматов, которые лучше учитывают сложности современного генеалогического исследования. Пока что GEDCOM остается важным инструментом для всех, кто работает с генеалогическими древами, и понимание его структуры и функциональности имеет решающее значение для эффективного управления данными и обмена в генеалогическом сообществе.