Последно актуализирано: 07 Feb, 2025

Какво е GEDCOM?
GEDCOM (Генеалогична комуникация на данни) е отворен файлов формат, създаден за съхраняване, обмен и споделяне на генеалогични данни (информация за семейни дървета). Той се използва широко в софтуер за генеалогия и уебсайтове, което улеснява прехвърлянето на данни за семейни дървета между различни платформи.

Кой разработи GEDCOM?
GEDCOM беше създаден от Църквата на Иисус Христос на Свещените от последните дни (LDS Church), която управлява FamilySearch — голяма организация за изследване на родословието. Целта им беше да опростят управлението на генеалогични данни и да позволят по‑добра сътрудничество в изследванията.
Как работи GEDCOM?
- Файловете GEDCOM са обикновени текстови файлове (от версия 7.0 използват UTF‑8 кодиране).
- Те съдържат информация за индивиди, като:
- Имена
- Дати на раждане и смърт
- Семейни връзки (родители, деца, съпрузи)
- Събития (брак, имиграция и др.)
- Тези записи са свързани чрез метаданни, което осигурява правилните връзки между членовете на семейството.
Версии на GEDCOM и индустриални стандарти
- Последната официална версия е GEDCOM 7.0, пусната през 2021.
- Въпреки това, GEDCOM 5.5.1 (от 1999, окончателно финализирана през 2019) остава най‑широко използваният стандарт.
- Поради ограниченията на GEDCOM 5.5.1, някои разработчици на софтуер за генеалогия създадоха персонализирани разширения, като GEDCOM 5.5 EL (Разширени местоположения), за да го подобрят.
Приемане на GEDCOM 7.0
- FamilySearch планира да поддържа GEDCOM 7.0 до третото тримесечие на 2022 г..
- Ancestry.com също прояви интерес към приемането му, но все още не е посочила конкретна дата за внедряване.
Защо GEDCOM е важен?
- Съвместимост между платформи – Позволява на потребителите да преместват данните за семейното си дърво между различни уебсайтове и софтуер за генеалогия.
- Дългосрочно съхранение на данни – Гарантира, че генеалогичните данни остават достъпни в стандартизиран формат.
- Сътрудничество в генеалогията – Позволява на изследователи и семейни историци да споделят и обединяват данни ефективно.
Обяснение на модела на данните в GEDCOM
GEDCOM използва модел на данните, свързан по родословие, за да организира семейните връзки по структуриран начин. Той се базира на концепцията за ядрено семейство, т.е. записва отношенията като родители и деца, а не само като отделни индивиди.
Ключови компоненти на модела на данните в GEDCOM
INDI (Individual) Records
- Всеки човек във файла се съхранява като запис INDI (индивид).
- На всеки индивид се присвоява уникален идентификационен номер, за да се осигури правилно свързване във файла.
FAM (Family) Records
- Записите FAM служат като структура за свързване между индивидите.
- Записът FAM задава:
- HUSB (мъж) – бащата в семейството.
- WIFE (жена) – майката в семейството.
- CHIL (дете) – децата на двойката.
- Тези етикети са исторически и произхождат от оригиналния модел на GEDCOM, но се използват и до днес.

Еволюция на представянето на пола в GEDCOM
- Първоначално моделът GEDCOM беше проектиран с предположението за хетеронормативна семейна структура, където мъж (HUSB) и жена (WIFE) имат деца (CHIL).
- GEDCOM 7.0 спецификацията уточнява, че тези термини не налагат полови роли или биологично родителство.
- Актуализираната спецификация позволява:
- Същополови двойки
- Осиновяване, приемни грижи и съжителство
- По‑гъвкави семейни структури
- Термините „партньори“, „родители“ или „съпрузи“ вече се предпочитат, когато се говори за индивиди в запис FAM.

Защо това е важно?
- Поддържа структурираните връзки – Гарантира, че всеки човек е правилно свързан с родители, съпрузи и деца.
- Подобрява съвместимостта – Позволява на софтуера за генеалогия да разпознава и организира семейните данни ефективно.
- Повишава инклузивността – Поддържа разнообразни семейни структури, без да се предполага традиционна полова роля.
Обяснение на структурата на GEDCOM файл
GEDCOM файлът се състои от три основни части: заглавната секция, секцията с записи и трейлър секцията. Всяка част изпълнява специфична роля при организирането на генеалогичните данни, а структурата е силно организирана, за да се гарантира, че връзките между индивидите и семействата са ясни и стандартизирани.
1. Секция на заглавието
- Секцията на заглавието маркира началото на GEDCOM файла и съдържа важни метаданни за самия файл, като версия (например GEDCOM 7.0) и всякакви специални настройки или конфигурации.
- Тази секция се представя чрез записа HEAD.
2. Секция на записите
Това е основната част на GEDCOM файла и включва няколко различни типа записи, всеки със специфична цел:
- INDI (Individual Record): Представлява отделен индивид в семейното дърво.
- FAM (Family Record): Представлява семейство, свързващо мъж, жена и деца.
- SOUR (Source Record): Съдържа информация за източниците, използвани за подкрепа на данните (например исторически документи).
- OBJE (Object Record): Представлява мултимедийни обекти, като снимки или документи, свързани с индивиди или семейства.
- NOTE (Note Record): Съдържа допълнителни бележки или коментари, които предоставят допълнителен контекст или обяснения за даден запис.
- REPO (Repository Record): Описва място, където се съхранява генеалогична информация, като библиотека или архив.
- SUBM (Submitter Record): Представлява лицето или организацията, подаваща GEDCOM файла.
Всеки от тези записи е структуриран йерархично, като различните номера на нива указват как данните са свързани. Например:
- Ниво 0 е най‑високото ниво за най‑значимите записи, като HEAD, TRLR, INDI, FAM, SOUR и др.
- Ниво 1 или по‑високо представлява под‑независими записи, като събития или връзки, свързани с конкретен индивид или семейство.
3. Секция на трейлъра
- Трейлър секцията маркира края на GEDCOM файла и съдържа записа TRLR. Тя указва, че файлът е завършен.

Как работи на практика
Номера на нива: Всеки ред в GEDCOM файл започва с номер на ниво (например 0, 1, 2), където 0 представлява най‑високите записи, а положителните цели числа (1, 2 и т.н.) представляват вложени или под‑независими записи. Тази система гарантира, че връзките и йерархиите в семейното дърво са правилно организирани.
Пример:
- Ниво 0: HEAD (заглавен запис), TRLR (трейлър запис), INDI (индивидуален запис)
- Ниво 1: MARR (брачно събитие), BIRT (рождено събитие)
- Ниво 2: DATE (дата на събитието), PLAC (място на събитието)
Ръчно писане на GEDCOM файл е технически възможно, но не е удобно за хора, поради строгата му структура. Много е по‑лесно да се използва софтуер, проектиран за работа с GEDCOM файлове, който помага да се организират и форматират данните правилно.
Валидация и контрол на качеството
- Тъй като GEDCOM файловете трябва да са добре структуриран, съществуват инструменти за валидация на грешки:
- PhpGedView проект: Включва GEDCOM валидатор за проверка на структурата.
- Windows GEDCOM валидатор: Самостоятелен инструмент за валидация на GEDCOM.
- Gedcheck: По‑старият валидиращ инструмент, използван преди от LDS църквата.
Предизвикателства с съвместимостта на GEDCOM
В началото на 2000‑те GEDCOM TestBook проект оценяваше колко добре различен софтуер за генеалогия спазва стандарта GEDCOM 5.5. Резултатите разкриха редица проблеми, като загуба на данни или неправилно четене на тега NOTE, който може да се появи на различни нива.
GEDCOM 7.0 се стреми да реши част от тези проблеми, а инструментите за валидация за новия стандарт помагат да се гарантира съвместимостта между различните платформи.
Защо е важна валидацията на GEDCOM?
- Гарантира, че данните са правилно структурирани и че връзките между индивиди, семейства, събития и източници се поддържат коректно.
- Помага да се избегне загуба на данни при прехвърляне на файлове между програми за генеалогия.
- Улеснява генеалоговите изследователи да споделят информация между различни платформи.
Примерен GEDCOM файл
Ето прост пример за GEDCOM файл и обяснение на неговата структура:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Разбивка и обяснение:
1. Секция на заглавието (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: Маркира началото на файла.
- 1 SOUR: Посочва източника на файла (например FamilySearch GEDCOM).
- 2 VERS 7.0: Указва версията на използвания GEDCOM формат (тук 7.0).
- 1 DEST: Посочва предвидената дестинация или система за данните (например Ancestry).
- 1 DATE: Датата, на която GEDCOM файлът е създаден (например 5 февруари 2025 г.).
- 1 SUBM: Обръща се към записа на подателя (@SUBM1@), който съдържа повече информация за лицето, подаващо файла.
2. Индивидуални записи (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: Маркира началото на индивидуален запис с уникален идентификатор (@I1@) за Джон Доу.
- 1 NAME John /Doe/: Името на индивида (Джон Доу).
- 1 SEX M: Полът на индивида (M = мъж).
- 1 BIRT: Посочва събитието „раждане“ на индивида.
- 2 DATE 1 JAN 1800: Датата на раждане (1 януари 1800 г.).
- 2 PLAC New York, USA: Мястото на раждане (Ню Йорк, САЩ).
3. Семейен запис (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: Маркира началото на семейния запис с уникален идентификатор (@F1@).
- 1 HUSB @I1@: Свързва съпруга (Джон Доу, ID @I1@).
- 1 WIFE @I2@: Свързва съпругата (Джейн Смит, ID @I2@).
- 1 CHIL @I3@: Свързва детето (Мери Доу, ID @I3@).
4. Втори индивидуален запис (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: Маркира началото на индивидуалния запис за Джейн Смит с уникален идентификатор (@I2@).
- 1 NAME Jane /Smith/: Името на индивида (Джейн Смит).
- 1 SEX F: Полът на индивида (F = жена).
- 1 BIRT: Посочва събитието „раждане“.
- 2 DATE 15 FEB 1805: Датата на раждане (15 февруари 1805 г.).
- 2 PLAC Boston, USA: Мястото на раждане (Бостън, САЩ).
5. Трети индивидуален запис (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: Маркира началото на индивидуалния запис за Мери Доу с уникален идентификатор (@I3@).
- 1 NAME Mary /Doe/: Името на индивида (Мери Доу).
- 1 SEX F: Полът на индивида (F = жена).
- 1 BIRT: Посочва събитието „раждане“.
- 2 DATE 10 OCT 1825: Датата на раждане (10 октомври 1825 г.).
- 2 PLAC New York, USA: Мястото на раждане (Ню Йорк, САЩ).
6. Секция на трейлъра (TRLR)
0 TRLR
- 0 TRLR: Маркира края на GEDCOM файла.
Обяснение на ключовите записи
- INDI (Individual) Records: Тези записи съдържат лични данни за конкретен индивид, като име, пол и дата на раждане.
- FAM (Family) Record: Този запис свързва индивиди, за да образува семейни единици. Той свързва родителите (HUSB и WIFE) и децата (CHIL) чрез техните уникални идентификатори.
- Бележка за идентификаторите: Всеки запис (индивид или семейство) получава уникален идентификатор (например
@I1@за Джон Доу). Тези идентификатори се използват за свързване на свързани записи, като например свързване на дете с неговите родители.
Ключови концепции
- Номера на нива: GEDCOM файловете използват номера на нива, за да организират данните в йерархична структура. Ниво 0 е за най‑горните записи (като INDI, FAM), а Ниво 1 и 2 се използват за под‑детайли (като събития и места).
- Имена в наклонени черти: Имената в GEDCOM често се поставят между наклонени черти, например John /Doe/, което отделя фамилията от собственото име.

Това е базов GEDCOM файл, но по‑сложни файлове могат да включват подробни събития (като бракове, смърт), източници (например преброявания) и мултимедийни препратки.
Заключение
GEDCOM е фундаментален елемент в областта на генеалогията, позволявайки обмен на генеалогични данни между различни софтуерни платформи. Неговият стандартизиран формат е позволил на изследователи, историци и любители да споделят и съхраняват семейната история ефективно. Въпреки широкото му приемане, GEDCOM не е без ограничения. Проблеми като съвместимост между софтуер, невъзможност за представяне на сложни семейни структури и липса на поддръжка за модерни типове данни подчертават нуждата от продължителни подобрения или алтернативни решения.
С развитието на технологиите генеалогията продължава да се променя, а бъдещето на GEDCOM може да включва актуализации на стандарта или разработване на нови формати, които по‑добре да отразяват сложността на съвременните генеалогични изследвания. Засега GEDCOM остава незаменим инструмент за всеки, който работи със семейни дървета, а разбирането на неговата структура и функционалност е от съществено значение за ефективно управление и споделяне на данни в генеалогичната общност.