Cập nhật lần cuối: 07 Tháng 2, 2025

GEDCOM là gì?
GEDCOM (Genealogical Data Communication) là một định dạng tệp mở được thiết kế để lưu trữ, trao đổi và chia sẻ dữ liệu phả hệ (thông tin gia phả). Nó được sử dụng rộng rãi trong phần mềm và trang web phả hệ, giúp dễ dàng chuyển đổi dữ liệu cây phả giữa các nền tảng khác nhau.

Ai đã phát triển GEDCOM?
GEDCOM được tạo ra bởi Nhà thờ của Chúa Giêsu Kitô của Các Thánh Hữu Ngày Sau (Nhà thờ LDS), tổ chức điều hành FamilySearch - một tổ chức nghiên cứu phả hệ lớn. Mục tiêu của họ là đơn giản hóa quản lý dữ liệu phả hệ và cho phép hợp tác nghiên cứu tốt hơn.
GEDCOM hoạt động như thế nào?
- Các tệp GEDCOM là tệp văn bản thuần túy (hiện sử dụng mã hóa UTF-8 kể từ phiên bản 7.0).
- Chúng chứa thông tin về các cá nhân, chẳng hạn như:
- Tên
- Ngày sinh và ngày mất
- Quan hệ gia đình (cha mẹ, con cái, vợ chồng)
- Sự kiện (hôn nhân, di cư, v.v.)
- Các bản ghi này được liên kết bằng siêu dữ liệu, đảm bảo kết nối đúng giữa các thành viên trong gia đình.
Phiên bản GEDCOM & Tiêu chuẩn ngành
- Phiên bản chính thức mới nhất là GEDCOM 7.0, phát hành năm 2021.
- Tuy nhiên, GEDCOM 5.5.1 (từ năm 1999, hoàn thiện năm 2019) vẫn là tiêu chuẩn được sử dụng rộng rãi nhất.
- Bởi vì GEDCOM 5.5.1 có nhiều hạn chế, một số nhà phát triển phần mềm phả hệ đã tạo ra mở rộng tùy chỉnh như GEDCOM 5.5 EL (Extended Locations) để cải thiện nó.
Sự chấp nhận của GEDCOM 7.0
- FamilySearch đã lên kế hoạch hỗ trợ GEDCOM 7.0 vào Quý 3 năm 2022.
- Ancestry.com cũng đã bày tỏ sự quan tâm trong việc chấp nhận nó nhưng chưa đưa ra ngày thực hiện cụ thể.
Tại sao GEDCOM quan trọng?
- Tương thích giữa các nền tảng – Cho phép người dùng chuyển dữ liệu cây phả của họ giữa các trang web và phần mềm phả hệ khác nhau.
- Lưu trữ dữ liệu dài hạn – Đảm bảo dữ liệu phả hệ vẫn có thể truy cập trong một định dạng tiêu chuẩn.
- Hợp tác phả hệ – Cho phép các nhà nghiên cứu và sử gia gia đình dễ dàng chia sẻ và gộp dữ liệu.
Giải thích Mô hình Dữ liệu GEDCOM
GEDCOM sử dụng mô hình dữ liệu liên kết thế hệ để tổ chức các quan hệ gia đình một cách cấu trúc. Nó dựa trên khái niệm gia đình hạt nhân, nghĩa là nó ghi lại các mối quan hệ theo hướng cha mẹ và con cái thay vì chỉ các cá nhân.
Các thành phần chính của Mô hình Dữ liệu GEDCOM
Bản ghi INDI (Cá nhân)
- Mỗi người trong tệp phả hệ được lưu trữ dưới dạng một bản ghi INDI (cá nhân).
- Mỗi cá nhân được gán một số ID duy nhất để đảm bảo liên kết chính xác trong tệp.
Bản ghi FAM (Gia đình)
- Bản ghi gia đình (FAM) đóng vai trò làm cấu trúc liên kết giữa các cá nhân.
- Một bản ghi FAM chỉ định:
- HUSB (chồng) – Cha trong gia đình.
- WIFE (vợ) – Mẹ trong gia đình.
- CHIL (con cái) – Các con của cặp đôi.
- Các nhãn này là lịch sử và được dựa trên mô hình GEDCOM ban đầu nhưng vẫn được sử dụng ngày nay.

Sự phát triển của Đại diện Giới tính trong GEDCOM
- Ban đầu, mô hình GEDCOM được thiết kế giả định một cấu trúc gia đình dị tính, nơi một nam (HUSB) và nữ (WIFE) có con cái (CHIL).
- Bản đặc tả GEDCOM 7.0 làm rõ rằng các thuật ngữ này không ngụ ý vai trò giới hoặc quan hệ cha mẹ sinh học.
- Đặc tả cập nhật cho phép:
- Cặp đôi cùng giới
- Nhận con nuôi, chăm sóc và sống chung
- Cấu trúc gia đình linh hoạt hơn
- Các thuật ngữ ‘đối tác’, ‘cha mẹ’, hoặc ‘vợ/chồng’ hiện được ưa chuộng khi nói đến các cá nhân trong một bản ghi FAM.

Tại sao điều này quan trọng?
- Duy trì các mối quan hệ có cấu trúc – Đảm bảo mỗi người được liên kết chính xác với cha mẹ, vợ/chồng, và con cái.
- Cải thiện Tương thích – Cho phép phần mềm phả hệ nhận dạng và tổ chức dữ liệu gia đình một cách hiệu quả.
- Tăng Tính Đa Dạng – Hỗ trợ các cấu trúc gia đình đa dạng mà không giả định các vai trò giới truyền thống.
Giải thích Cấu trúc của Tệp GEDCOM
Một tệp GEDCOM bao gồm ba phần chính: phần đầu, phần bản ghi, và phần cuối. Mỗi phần đóng vai trò cụ thể trong việc tổ chức dữ liệu phả hệ, và cấu trúc của tệp được tổ chức chặt chẽ để đảm bảo rằng các quan hệ giữa các cá nhân và gia đình rõ ràng và tiêu chuẩn hóa.
1. Phần Đầu (Header Section)
- Phần đầu đánh dấu sự bắt đầu của tệp GEDCOM và bao gồm phần siêu dữ liệu quan trọng về bản thân tệp, chẳng hạn như phiên bản của nó (ví dụ: GEDCOM 7.0) và bất kỳ cài đặt hoặc cấu hình đặc biệt nào cho tệp.
- Phần này được đại diện bởi bản ghi HEAD.
2. Phần Bản ghi (Records Section)
Đây là phần chính của tệp GEDCOM và bao gồm nhiều loại bản ghi khác nhau, mỗi loại phục vụ một mục đích cụ thể:
- INDI (Bản ghi Cá nhân): Đại diện cho một cá nhân trong cây phả hệ.
- FAM (Bản ghi Gia đình): Đại diện cho một gia đình, kết nối chồng, vợ và con cái.
- SOUR (Bản ghi Nguồn): Chứa thông tin về các nguồn được sử dụng để hỗ trợ dữ liệu, chẳng hạn như hồ sơ lịch sử.
- OBJE (Bản ghi Đối tượng): Đại diện cho các đối tượng đa phương tiện, như ảnh hoặc tài liệu, gắn liền với cá nhân hoặc gia đình.
- NOTE (Bản ghi Ghi chú): Chứa các ghi chú hoặc nhận xét bổ sung có thể cung cấp ngữ cảnh hoặc giải thích thêm cho một bản ghi.
- REPO (Bản ghi Kho): Mô tả một nơi lưu trữ thông tin phả hệ, như thư viện hoặc kho lưu trữ.
- SUBM (Bản ghi Người nộp): Đại diện cho người hoặc thực thể nộp tệp GEDCOM.
Mỗi bản ghi này được cấu trúc theo thứ bậc, với các mức số khác nhau cho biết cách dữ liệu liên quan. Ví dụ:
- Mức 0 là mức cao nhất cho các bản ghi quan trọng nhất, như HEAD, TRLR, INDI, FAM, SOUR, v.v.
- Mức 1 trở lên đại diện cho bản ghi cấp con, như sự kiện hoặc quan hệ liên quan đến cá nhân hoặc gia đình cụ thể.
3. Phần Kết thúc (Trailer Section)
- Phần kết thúc đánh dấu sự kết thúc của tệp GEDCOM và chứa bản ghi TRLR. Nó biểu thị rằng tệp đã hoàn thành.

Cách hoạt động trong thực tế
Mức Số: Mỗi dòng trong tệp GEDCOM bắt đầu với một mức số (ví dụ: 0, 1, 2), nơi 0 đại diện cho các bản ghi cấp cao nhất và các số nguyên dương (1, 2, v.v.) đại diện cho các bản ghi lồng hoặc phụ thuộc. Hệ thống này đảm bảo rằng các mối quan hệ và phân cấp trong cây phả được tổ chức chính xác.
Ví dụ:
- Mức 0: HEAD (Bản ghi Đầu), TRLR (Bản ghi Kết thúc), INDI (Bản ghi Cá nhân)
- Mức 1: MARR (Sự kiện Hôn nhân), BIRT (Sự kiện Sinh)
- Mức 2: DATE (Ngày của sự kiện), PLAC (Nơi của sự kiện)
Viết tay một tệp GEDCOM là khả thi về mặt kỹ thuật, nhưng nó không thân thiện với con người do tính chất có cấu trúc của nó. Sử dụng phần mềm được thiết kế để làm việc với các tệp GEDCOM sẽ giúp tổ chức và định dạng dữ liệu dễ dàng hơn.
Kiểm tra và Kiểm soát Chất lượng
- Vì các tệp GEDCOM cần phải có cấu trúc tốt để sử dụng và chuyển đổi đúng cách, có các công cụ để kiểm tra chúng nhằm phát hiện lỗi.
- Dự án PhpGedView: Bao gồm một tính năng kiểm tra GEDCOM để kiểm tra cấu trúc.
- Công cụ Kiểm tra GEDCOM Windows: Một công cụ độc lập dùng để kiểm tra GEDCOM.
- Gedcheck: Công cụ kiểm tra cũ hơn, đã từng được sử dụng bởi Nhà thờ LDS.
Thách thức với Tính Tương thích của GEDCOM
Vào đầu những năm 2000, Dự án TestBook GEDCOM đã đánh giá mức độ tuân thủ của phần mềm phả hệ với tiêu chuẩn GEDCOM 5.5. Kết quả đã tiết lộ một số vấn đề, chẳng hạn như mất dữ liệu hoặc đọc không đúng thẻ NOTE, có thể xuất hiện ở nhiều cấp độ.
GEDCOM 7.0 nhằm khắc phục một số vấn đề này, và các công cụ kiểm tra đối chiếu cho tiêu chuẩn mới hơn này tồn tại để đảm bảo tính tương thích trên các nền tảng khác nhau.
Tại sao Kiểm tra GEDCOM Quan trọng?
- Đảm bảo rằng dữ liệu có cấu trúc đúng cách và các mối quan hệ giữa cá nhân, gia đình, sự kiện và nguồn được duy trì đúng cách.
- Giúp tránh mất dữ liệu khi chuyển tệp giữa các chương trình phả hệ.
- Làm cho dễ dàng hơn đối với nhà nghiên cứu phả hệ để chia sẻ thông tin trên các nền tảng khác nhau.
Ví dụ về Tệp GEDCOM
Dưới đây là một ví dụ đơn giản về tệp GEDCOM và cách giải thích cấu trúc của nó:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Phân tích và Giải thích:
1. Phần Đầu (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: Đánh dấu bắt đầu của tệp.
- 1 SOUR: Chỉ ra nguồn gốc của tệp (ví dụ: FamilySearch GEDCOM).
- 2 VERS 7.0: Chỉ định phiên bản của định dạng GEDCOM được sử dụng (7.0 ở đây).
- 1 DEST: Chỉ ra đích hoặc hệ thống dự kiến cho dữ liệu (ví dụ: Ancestry).
- 1 DATE: Ngày tạo tệp GEDCOM (ví dụ: 5 tháng 2 năm 2025).
- 1 SUBM: Chỉ tới bản ghi người nộp (@SUBM1@), trong đó sẽ có thêm thông tin về người nộp tệp.
2. Bản ghi Cá nhân (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: Đánh dấu bắt đầu của bản ghi cá nhân với một ID duy nhất (@I1@) cho John Doe.
- 1 NAME John /Doe/: Tên của cá nhân (John Doe).
- 1 SEX M: Giới tính của cá nhân (M cho Nam).
- 1 BIRT: Cho biết sự kiện sinh của cá nhân.
- 2 DATE 1 JAN 1800: Ngày sinh (1 tháng 1 năm 1800).
- 2 PLAC New York, USA: Nơi sinh (New York, USA).
3. Bản ghi Gia đình (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: Đánh dấu bắt đầu của bản ghi gia đình với một ID duy nhất (@F1@).
- 1 HUSB @I1@: Liên kết người chồng (John Doe, ID @I1@).
- 1 WIFE @I2@: Liên kết người vợ (Jane Smith, ID @I2@).
- 1 CHIL @I3@: Liên kết người con (Mary Doe, ID @I3@).
4. Bản ghi Cá nhân Thứ hai (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: Đánh dấu bắt đầu của bản ghi cá nhân của Jane Smith với một ID duy nhất (@I2@).
- 1 NAME Jane /Smith/: Tên của cá nhân (Jane Smith).
- 1 SEX F: Giới tính của cá nhân (F cho Nữ).
- 1 BIRT: Cho biết sự kiện sinh của cá nhân.
- 2 DATE 15 FEB 1805: Ngày sinh (15 tháng 2 năm 1805).
- 2 PLAC Boston, USA: Nơi sinh (Boston, USA).
5. Bản ghi Cá nhân Thứ ba (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: Đánh dấu bắt đầu của bản ghi cá nhân của Mary Doe với một ID duy nhất (@I3@).
- 1 NAME Mary /Doe/: Tên của cá nhân (Mary Doe).
- 1 SEX F: Giới tính của cá nhân (F cho Nữ).
- 1 BIRT: Cho biết sự kiện sinh của cá nhân.
- 2 DATE 10 OCT 1825: Ngày sinh (10 tháng 10 năm 1825).
- 2 PLAC New York, USA: Nơi sinh (New York, USA).
6. Phần Kết thúc (TRLR)
0 TRLR
- 0 TRLR: Đánh dấu kết thúc của tệp GEDCOM.
Giải thích về Các Bản ghi Chính
- Bản ghi INDI (Cá nhân): Chứa các chi tiết cá nhân về một cá nhân cụ thể, như tên, giới tính và ngày sinh.
- Bản ghi FAM (Gia đình): Kết nối các cá nhân để tạo thành các đơn vị gia đình. Nó liên kết cha mẹ (HUSB và WIFE) và con cái (CHIL) sử dụng các ID duy nhất.
- Chú ý về ID: Mỗi bản ghi (cá nhân hoặc gia đình) có một ID duy nhất được gán cho nó (ví dụ:
@I1@
cho John Doe). Những ID này được sử dụng để liên kết các bản ghi liên quan, chẳng hạn như liên kết một đứa trẻ với cha mẹ của chúng.
Các Khái niệm Chính
- Mức Số: Tệp GEDCOM sử dụng mức số để tổ chức dữ liệu theo cấu trúc phân cấp. Mức 0 dành cho các bản ghi cấp cao nhất (như INDI, FAM), và Mức 1 và 2 được sử dụng cho các chi tiết cấp con (như sự kiện và địa điểm).
- Tên trong Dấu Gạch Chéo: Tên trong GEDCOM thường được đặt trong dấu gạch chéo, như John /Doe/, để phân biệt giữa tên họ và tên cho.

Đây là một tệp GEDCOM cơ bản, nhưng các tệp phức tạp hơn có thể bao gồm sự kiện chi tiết (như hôn nhân, tử vong), nguồn (ví dụ: hồ sơ điều tra dân số), và các tham chiếu đa phương tiện.
Kết luận
GEDCOM đã là một phần quan trọng trong lĩnh vực phả hệ, cho phép trao đổi dữ liệu phả hệ trên các nền tảng phần mềm khác nhau. Định dạng tiêu chuẩn của nó đã cho phép các nhà nghiên cứu, sử gia và những người làm việc yêu thích sẻ chia và duy trì dữ liệu lịch sử gia đình một cách hiệu quả. Tuy nhiên, dù được sử dụng rộng rãi, GEDCOM vẫn có những hạn chế. Vấn đề như khả năng tương thích giữa phần mềm, không thể đại diện cho các mối quan hệ phức tạp, và thiếu hỗ trợ cho các loại dữ liệu hiện đại làm nổi bật nhu cầu cải tiến liên tục hoặc các giải pháp thay thế.
Khi phả hệ tiếp tục phát triển với sự tiến bộ trong công nghệ, tương lai của GEDCOM có thể bao gồm các cập nhật tiêu chuẩn hoặc phát triển các định dạng mới phù hợp hơn với các phức tạp của nghiên cứu phả hệ hiện đại. Hiện tại, GEDCOM vẫn là một công cụ thiết yếu cho bất kỳ ai làm việc với cây gia đình, và việc hiểu cấu trúc và chức năng của nó là quan trọng để quản lý dữ liệu và chia sẻ hiệu quả trong cộng đồng phả hệ.