Last Updated: 07 лютого, 2025

Що таке GEDCOM?
GEDCOM (Genealogical Data Communication) — це відкритий формат файлу, призначений для зберігання, обміну та спільного використання генеалогічних даних (інформації про сімейне дерево). Він широко використовується в генеалогічному програмному забезпеченні та веб‑сайтах, полегшуючи перенесення даних сімейного дерева між різними платформами.

Хто розробив GEDCOM?
GEDCOM був створений Церквою Ісуса Христа Святих останніх днів (LDS Church), яка керує FamilySearch — великою організацією з генеалогічних досліджень. Їхньою метою було спростити управління генеалогічними даними та забезпечити кращу співпрацю у дослідженнях.
Як працює GEDCOM?
- Файли GEDCOM — це текстові файли (зараз використовують кодування UTF-8 починаючи з версії 7.0).
- Вони містять інформацію про осіб, зокрема:
- Імена
- Дати народження та смерті
- Сімейні зв’язки (батьки, діти, подружжя)
- Події (шлюб, імміграція тощо)
- Ці записи зв’язуються за допомогою метаданих, забезпечуючи правильні зв’язки між членами сім’ї.
Версії GEDCOM та галузеві стандарти
- Найновішою офіційною версією є GEDCOM 7.0, випущена у 2021 році.
- Проте, GEDCOM 5.5.1 (з 1999 року, остаточно затверджений у 2019)** залишається найбільш поширеним стандартом.
- Через обмеження GEDCOM 5.5.1, деякі розробники генеалогічного ПЗ створили кастомні розширення, такі як GEDCOM 5.5 EL (Extended Locations), щоб його покращити.
Прийняття GEDCOM 7.0
- FamilySearch планувала підтримувати GEDCOM 7.0 до III кварталу 2022.
- Ancestry.com також виявив інтерес до його впровадження, проте не надала конкретної дати реалізації.
Чому GEDCOM важливий?
- Сумісність між платформами – дозволяє користувачам переносити дані свого сімейного дерева між різними генеалогічними веб‑сайтами та програмами.
- Довгострокове зберігання даних – гарантує, що генеалогічні дані залишаються доступними у стандартизованому форматі.
- Генеалогічна співпраця – дозволяє дослідникам і сімейним історикам ефективно ділитися та об’єднувати дані.
Пояснення моделі даних GEDCOM
GEDCOM використовує модель даних, пов’язану за родовим ланцюгом, щоб організовувати сімейні зв’язки у структурований спосіб. Вона базується на концепції ядерної сім’ї, тобто записує відносини у вигляді батьків та дітей, а не лише окремих осіб.
Ключові компоненти моделі даних GEDCOM
INDI (Individual) – записи про особу
- Кожна особа у генеалогічному файлі зберігається як запис INDI (individual).
- Кожній особі присвоюється унікальний ідентифікатор, щоб забезпечити правильне зв’язування у файлі.
FAM (Family) – записи про сім’ю
- Записи про сім’ю (FAM) слугують структурою зв’язку між особами.
- Запис FAM містить:
- HUSB (husband) – батько у сім’ї.
- WIFE (wife) – мати у сім’ї.
- CHIL (child) – діти пари.
- Ці позначення історичні і базуються на оригінальній моделі GEDCOM, проте їх досі використовують.

Еволюція представлення гендеру в GEDCOM
- Спочатку модель GEDCOM була розроблена з урахуванням гетеронормативної сімейної структури, де чоловік (HUSB) і жінка (WIFE) мають дітей (CHIL).
- Специфікація GEDCOM 7.0 уточнює, що ці терміни не передбачають гендерних ролей чи біологічного батьківства.
- Оновлена специфікація дозволяє:
- Одностатеві пари
- Усиновлення, прийом у сім’ю та спільне проживання
- Більш гнучкі сімейні структури
- Тепер у записах FAM перевагу надають термінам ‘partners’, ‘parents’ або ‘spouses’ при посиланні на осіб.

Чому це важливо?
- Зберігає структуровані зв’язки – гарантує, що кожна особа правильно пов’язана з батьками, подружжям та дітьми.
- Покращує сумісність – дозволяє генеалогічному ПЗ розпізнавати та ефективно організовувати сімейні дані.
- Збільшує інклюзивність – підтримує різноманітні сімейні структури без припущень про традиційні гендерні ролі.
Пояснення структури файлу GEDCOM
GEDCOM файл складається з трьох основних розділів: заголовка, записів та завершення. Кожен розділ виконує певну роль у організації генеалогічних даних, а структура файлу ретельно упорядкована, щоб забезпечити чіткі та стандартизовані зв’язки між особами та сім’ями.
1. Розділ заголовка
- Розділ заголовка позначає початок файлу GEDCOM і містить важливі метадані про сам файл, такі як його версія (наприклад, GEDCOM 7.0) та будь‑які спеціальні налаштування чи конфігурації.
- Цей розділ представлений записом HEAD.
2. Розділ записів
Це основна частина файлу GEDCOM, що складається з кількох різних типів записів, кожен з яких має певне призначення:
- INDI (Individual Record): Представляє окрему особу у сімейному дереві.
- FAM (Family Record): Представляє сім’ю, зв’язуючи чоловіка, жінку та дітей.
- SOUR (Source Record): Містить інформацію про джерела, використані для підтвердження даних, наприклад історичні записи.
- OBJE (Object Record): Представляє мультимедійні об’єкти, такі як фотографії чи документи, пов’язані з особами або сім’ями.
- NOTE (Note Record): Містить додаткові нотатки або коментарі, які можуть надати додатковий контекст або пояснення до запису.
- REPO (Repository Record): Описує місце, де зберігається генеалогічна інформація, наприклад бібліотеку чи архів.
- SUBM (Submitter Record): Представляє особу або організацію, що подає файл GEDCOM.
Кожен із цих записів має ієрархічну структуру, де різні рівневі номери вказують на взаємозв’язок даних. Наприклад:
- Рівень 0 – це верхній рівень для найважливіших записів, таких як HEAD, TRLR, INDI, FAM, SOUR тощо.
- Рівень 1 або вище – представляє підрівневі записи, такі як події чи зв’язки, прив’язані до конкретної особи або сім’ї.
3. Розділ завершення
- Розділ завершення позначає кінець файлу GEDCOM і містить запис TRLR. Це означає, що файл завершено.

Як це працює на практиці
Рівневі номери: Кожен рядок у файлі GEDCOM починається з рівневого номера (наприклад, 0, 1, 2), де 0 представляє верхні записи, а позитивні цілі числа (1, 2 тощо) представляють вкладені або підпорядковані записи. Це забезпечує правильну організацію ієрархії та зв’язків у сімейному дереві.
Приклад:
- Рівень 0: HEAD (запис заголовка), TRLR (запис завершення), INDI (запис особи)
- Рівень 1: MARR (подія шлюбу), BIRT (подія народження)
- Рівень 2: DATE (дата події), PLAC (місце події)
Ручне написання GEDCOM файлу технічно можливо, але це не зручно для людини через його строгий формат. Набагато простіше використовувати спеціалізоване ПЗ, яке автоматично форматує та організовує дані.
Перевірка та контроль якості
- Оскільки GEDCOM файли мають бути добре структурованими для коректного використання та передачі, існують інструменти для перевірки їх на помилки.
- PhpGedView Project: включає валідатор GEDCOM для перевірки структури.
- The Windows GEDCOM Validator: автономний інструмент для валідації GEDCOM.
- Gedcheck: старіший інструмент валідації, раніше використовувався Церквою LDS.
Виклики сумісності GEDCOM
На початку 2000‑х років GEDCOM TestBook Project оцінював, наскільки різне генеалогічне ПЗ відповідає стандарту GEDCOM 5.5. Результати виявили кілька проблем, таких як втрата даних або неправильне читання тегу NOTE, який може з’являтися на різних рівнях.
GEDCOM 7.0 прагне вирішити частину цих проблем, і для новішого стандарту існують інструменти валідації, які допомагають забезпечити сумісність між різними платформами.
Чому важлива перевірка GEDCOM?
- Забезпечує правильну структуру даних та збереження зв’язків між особами, сім’ями, подіями та джерелами.
- Допомагає уникнути втрати даних під час передачі файлів між різними генеалогічними програмами.
- Спрощує обмін інформацією між генеалогами на різних платформах.
Приклад файлу GEDCOM
Ось простий приклад GEDCOM файлу та пояснення його структури:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Розбір та пояснення:
1. Розділ заголовка (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: Позначає початок файлу.
- 1 SOUR: Вказує джерело файлу (наприклад, FamilySearch GEDCOM).
- 2 VERS 7.0: Вказує версію формату GEDCOM, що використовується (тут 7.0).
- 1 DEST: Вказує цільову систему або платформу для даних (наприклад, Ancestry).
- 1 DATE: Дата створення GEDCOM файлу (наприклад, 5 лютого 2025).
- 1 SUBM: Посилається на запис подавача (@SUBM1@), який містить додаткову інформацію про особу, що подає файл.
2. Записи особи (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: Початок запису особи з унікальним ідентифікатором (@I1@) для John Doe.
- 1 NAME John /Doe/: Ім’я особи (John Doe).
- 1 SEX M: Стать особи (M – чоловіча).
- 1 BIRT: Позначає подію народження.
- 2 DATE 1 JAN 1800: Дата народження (1 січня 1800).
- 2 PLAC New York, USA: Місце народження (New York, США).
3. Запис сім’ї (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: Початок запису сім’ї з унікальним ідентифікатором (@F1@).
- 1 HUSB @I1@: Пов’язує чоловіка (John Doe, ID @I1@).
- 1 WIFE @I2@: Пов’язує жінку (Jane Smith, ID @I2@).
- 1 CHIL @I3@: Пов’язує дитину (Mary Doe, ID @I3@).
4. Другий запис особи (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: Початок запису Jane Smith з унікальним ідентифікатором (@I2@).
- 1 NAME Jane /Smith/: Ім’я особи (Jane Smith).
- 1 SEX F: Стать особи (F – жіноча).
- 1 BIRT: Подія народження.
- 2 DATE 15 FEB 1805: Дата народження (15 лютого 1805).
- 2 PLAC Boston, USA: Місце народження (Boston, США).
5. Третій запис особи (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: Початок запису Mary Doe з унікальним ідентифікатором (@I3@).
- 1 NAME Mary /Doe/: Ім’я особи (Mary Doe).
- 1 SEX F: Стать особи (F – жіноча).
- 1 BIRT: Подія народження.
- 2 DATE 10 OCT 1825: Дата народження (10 жовтня 1825).
- 2 PLAC New York, USA: Місце народження (New York, США).
6. Розділ завершення (TRLR)
0 TRLR
- 0 TRLR: Позначає кінець файлу GEDCOM.
Пояснення ключових записів
- INDI (Individual) Records: Ці записи містять особисті дані конкретної особи, такі як ім’я, стать та дата народження.
- FAM (Family) Record: Цей запис зв’язує особи у сімейні одиниці. Він з’єднує батьків (HUSB і WIFE) та дитин (CHIL) за допомогою їхніх унікальних ідентифікаторів.
- Примітка щодо ідентифікаторів: Кожному запису (особа або сім’я) присвоюється унікальний ідентифікатор (наприклад,
@I1@для John Doe). Ці ідентифікатори використовуються для зв’язку пов’язаних записів, наприклад, для прив’язки дитини до її батьків.
Ключові концепції
- Рівневі номери: Файли GEDCOM використовують рівневі номери для організації даних у ієрархічну структуру. Рівень 0 – це верхні записи (наприклад, INDI, FAM), а рівні 1 і 2 – це підрівневі деталі (наприклад, події та місця).
- Імена в косих рисках: Імена в GEDCOM часто розміщуються між косими рисками, наприклад John /Doe/, що розрізняє прізвище від імені.

Це базовий GEDCOM файл, проте більш складні файли можуть містити докладні події (шлюби, смерті), джерела (наприклад, перепис населення) та мультимедійні посилання.
Висновок
GEDCOM став фундаментом у галузі генеалогії, дозволяючи обмінюватися генеалогічними даними між різними програмними платформами. Його стандартизований формат дозволив дослідникам, історикам та аматорам ефективно ділитися та зберігати дані про сімейну історію. Однак, незважаючи на широке впровадження, GEDCOM має свої обмеження. Проблеми сумісності між програмами, неможливість представлення складних родинних зв’язків та відсутність підтримки сучасних типів даних підкреслюють необхідність постійних удосконалень або альтернативних рішень.
У міру того, як генеалогія розвивається разом із технологічними інноваціями, майбутнє GEDCOM може включати оновлення стандарту або розробку нових форматів, які краще враховуватимуть складність сучасних генеалогічних досліджень. Поки що GEDCOM залишається незамінним інструментом для всіх, хто працює з сімейними деревами, а розуміння його структури та функціональності є ключовим для ефективного управління та обміну даними в генеалогічному співтоваристві.