最後更新: 2025年2月7日

什麼是 GEDCOM?
GEDCOM (Genealogical Data Communication) 是一種設計用來存儲、交換和共享家譜資料(家譜信息)的開放檔案格式。它廣泛用於家譜軟體和網站,使得在不同平台之間傳輸家譜資料變得更加容易。

誰開發了 GEDCOM?
GEDCOM 是由耶穌基督後期聖徒教會(LDS教會)創建的,該教會運營著一個主要的家譜研究組織——FamilySearch。他們的目標是簡化家譜資料的管理,並促進更好的研究合作。
GEDCOM 如何運作?
- GEDCOM 檔案是純文字檔案(從第 7.0 版開始使用 UTF-8 編碼)。
- 它們包含有關個體的信息,如:
- 姓名
- 出生和死亡日期
- 家庭關係(父母、子女、配偶)
- 事件(婚姻、移民等)
- 這些記錄使用元數據進行鏈接,以確保家族成員之間的正確連接。
GEDCOM 版本與行業標準
- 最新的正式版本是 GEDCOM 7.0,於 2021 年發布。
- 然而, GEDCOM 5.5.1(自 1999 年發布,於 2019 年完成)仍然是最廣泛使用的標準。
- 因為 GEDCOM 5.5.1 存在限制,一些家譜軟體開發者創建了自定義擴展如**GEDCOM 5.5 EL(擴展位置)**來改進它。
GEDCOM 7.0 的採用
- FamilySearch 計劃在 2022 年第三季度支持 GEDCOM 7.0。
- Ancestry.com 也表示有興趣採用它,但尚未提供確切的實施日期。
為什麼 GEDCOM 很重要?
- 跨平台兼容性 – 允許用戶在不同的家譜網站和軟體之間移動家譜資料。
- 長期資料存儲 – 確保家譜資料以標準化格式保持可訪問。
- 家譜合作 – 使研究人員和家族歷史學家能夠有效地共享和合併資料。
GEDCOM 資料模型的解釋
GEDCOM 使用一種家譜鏈接資料模型,以結構化的方式組織家庭關係。它基於核心家庭概念,意味著它是以父母和子女的關係,而不僅僅是個體來記錄。
GEDCOM 資料模型的關鍵組成部分
INDI(個體)記錄
- 家譜檔案中的每個人都被存儲為一個 INDI(個體)記錄。
- 每個個人都有一個唯一的 ID 號碼,以確保在檔案中正確鏈接。
FAM(家庭)記錄
- 家庭記錄(FAM)作為個體之間的鏈接結構。
- 一個 FAM 記錄分配:
- HUSB(丈夫) – 家庭中的父親。
- WIFE(妻子) – 家庭中的母親。
- CHIL(子女) – 這對夫妻的子女。
- 這些標籤是歷史性的,基於原始的 GEDCOM 模型,但今天仍被使用。

GEDCOM 中性別表示的演變
- 最初,GEDCOM 模型是在假設異性戀家庭結構的情況下設計的,其中有男性(HUSB)和女性(WIFE)擁有子女(CHIL)。
- GEDCOM 7.0 規範 澄清了這些術語不暗示性別角色或生物學上的親子關係。
- 更新後的說明允許:
- 同性夫妻
- 收養、寄養和同居
- 更靈活的家庭結構
- 現在,在提及 FAM 記錄中的個體時,優先使用**“伴侶”、“父母”或“配偶”**等術語。

為什麼這很重要?
- 保持結構化的關係 – 確保每個人正確地與父母、配偶和子女連接。
- 提高兼容性 – 允許家譜軟體識別和組織家庭資料有效。
- 增加包容性 – 支持多樣的家庭結構,無需假定傳統性別角色。
GEDCOM 檔案結構的解釋
一個 GEDCOM 檔案 包含三個主要部分:標題、記錄和結尾。每一部分在組織家譜資料中扮演著特定的角色,檔案的結構高度組織化,以確保個體和家庭之間的關係清晰且標準化。
1. 標題部分(HEAD)
- 標題部分標誌著 GEDCOM 檔案的開始,包含有關檔案本身的重要元數據,例如其版本(如 GEDCOM 7.0)以及檔案的任何特殊設置或配置。
- 此部分由HEAD記錄表示。
2. 記錄部分
這是 GEDCOM 檔案的主體部分,由幾種類型的記錄組成,每種記錄都有特定的用途:
- INDI(個體記錄): 代表家譜中的一個個體。
- FAM(家庭記錄): 代表一個家庭,連接丈夫、妻子和子女。
- SOUR(來源記錄): 包含有關支持數據的來源的信息,如曆史記錄。
- OBJE(對象記錄): 表示與個體或家庭相關的多媒體對象,如照片或文檔。
- NOTE(註釋記錄): 包含提供額外背景信息或解釋的附加註釋或註釋。
- REPO(存儲庫記錄): 描述儲存家譜信息的地方,如圖書館或檔案館。
- SUBM(提交者記錄): 表示提交 GEDCOM 檔案的個人或實體。
這些記錄中的每一個都有層次結構,每個不同的級別數字表示資料之間的關聯。例:
- 0 級是最頂級記錄,如HEAD, TRLR, INDI, FAM, SOUR等。
- 1 級或更高級 表示次級記錄,如與特定個體或家庭相關的事件或關係。
3. 結尾部分
- 結尾部分 標誌著 GEDCOM 檔案的結束,並包含 TRLR 記錄,這表示檔案已結束。

實踐中的運行方式
級別數字: GEDCOM 檔案中的每一行都始於一個級別數字(例如,0、1、2),其中0表示最高級的記錄,如 HEAD、TRLR、INDI、FAM、SOUR 等。
級別1或更高 表示有關係或附屬的記錄,如專屬於某個個體或家庭的事件或關係。
例如:
- 等級 0:HEAD(標題記錄)、TRLR(結尾記錄)、INDI(個體記錄)
- 級別 1:MARR(婚姻事件)、BIRT(出生事件)
- 級別 2:DATE(事件日期)、PLAC(事件地點)
手寫 GEDCOM 檔案 實際上是可以的,但由於其結構化的特性,對人類來說並不友好。使用專門為 GEDCOM 檔案設計的軟體更容易,因為它有助於正確組織和格式化數據。
驗證和質量控制
- 由於 GEDCOM 檔案需要結構良好才能正確使用和傳輸,所以有一些工具可以驗證它們是否有錯誤。
- PhpGedView Project:包括一個用于檢查結構的 GEDCOM 驗證器。
- The Windows GEDCOM Validator:一個用於 GEDCOM 驗證的獨立工具。
- Gedcheck:一個較早的驗證工具,先前由 LDS 教會使用。
GEDCOM 兼容性的挑戰
在2000年代初期,GEDCOM TestBook 專案評估了不同家譜軟體遵循GEDCOM 5.5 標準的情況。結果揭示了一些問題,如資料丟失或不正確的閱讀NOTE 標籤,該標籤可以出現在多個層次。
GEDCOM 7.0 旨在解決其中一些問題,而驗證工具也為此進行了改進。
這為什麼很重要?
- 保持結構化的關係– 確保每個人的關係、家庭、事件和來源的資料得以保持。
- 提高兼容性– 避免在不同家譜軟體之間傳輸檔案時出現資料丟失。
- 便于信息分享– 使家譜學者能夠在不同平台之間輕松分享信息。
GEDCOM 檔案範例
這是一個簡單的 GEDCOM 檔案示例及其結構的說明:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 2025年2月5日
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1800年1月1日
2 PLAC 美國紐約州
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 1805年2月15日
2 PLAC 美國波士頓
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 1825年10月10日
2 PLAC 紐約, 美國
0 TRLR
拆解和説明:
1. 標題部分(HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 2025年2月5日
1 SUBM @SUBM1@
- 0 HEAD: 標誌著GEDCOM檔案的開始並包括有關檔案本身的重要元數據,如其版本(例如,GEDCOM 7.0)和檔案的任何特殊設置或配置。
- 1 SOUR: 表示文件的來源(例如,FamilySearch GEDCOM)。
- 2 VERS 7.0: 指定所使用的 GEDCOM 格式版本(此處為 7.0)。
- 1 DEST: 表明資料所針對的目標或系統(如Ancestry)。
- 1 DATE: GEDCOM檔案創建的日期(例如,2025年2月5日)。
- 1 SUBM: 指向提交者記錄(@SUBM1@),其中將有更多有關提交該檔案的人的信息。
2. 個體記錄 (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1800年1月1日
2 PLAC 美國紐約
- 0 INDI @I1@: 標誌著John Doe的個體記錄的開始,具有唯一的ID(@I1@)。
- 1 NAME John /Doe/: 個體的姓名(John Doe)。
- 1 SEX M: 個體的性別(男性M)。
- 1 BIRT: 表示個體的出生事件。
- 2 DATE 1800年1月1日: 出生日期(1800年1月1日)。
- 2 PLAC 美國紐約: 出生地(美國紐約)。
3. 家庭記錄 (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: 用唯一ID(@F1@)標誌著一個家庭記錄的開始。
- 1 HUSB @I1@: 連接丈夫(John Doe,ID @I1@)。
- 1 WIFE @I2@: 連接妻子(Jane Smith,ID @I2@)。
- 1 CHIL @I3@: 連接子女(Mary Doe,ID @I3@)。
4. 第二個個體記錄 (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 1805年2月15日
2 PLAC 美國波士頓
- 0 INDI @I2@: 表示Jane Smith的個人物記錄開始,具有唯一ID(@I2@)。
- 1 NAME Jane /Smith/:個人的姓名(珍·史密斯)。
- 1 SEX F:個人的性別(F 代表女性)。
- 1 BIRT:表示個體的出生事件。
- 2 DATE 1805年2月15日:出生日期(1805年2月15日)。
- 2 PLAC 美國波士頓:出生地(美國波士頓)。
5. 第三份個體記錄(INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 1825年10月10日
2 PLAC 美國紐約
- 0 INDI @I3@: 表示Mary Doe的個人物記錄開始,具有唯一ID(@I3@)。
- 1 NAME Mary /Doe/:個人的名字(Mary Doe)。
- 1 SEX F: 個人的性別(F代表女性)。
- 1 BIRT: 表示個人出生事件。
- 2 DATE 10 OCT 1825: 出生日期 (10月10日1825年)。
- 2 PLAC 美國紐約: 出生地 (美國紐約)。
6. 結尾部分(TRLR)
0 TRLR
- 0 TRLR:標誌GEDCOM檔案的結尾。
關鍵記錄的解釋
- INDI(個體)記錄: 這些記錄包含有關特定個體的個人詳細信息,如姓名、性別和出生日期。
- FAM(家庭)記錄: 這個記錄將個體聯繫成為一個家庭單位。使用它連接 父母(HUSB 和 WIFE) 以及子女(CHIL),使用它們的唯一ID進行連接。
- 關於ID的說明: 每個記錄(個體或家庭)都有一個唯一的ID分配給它(如John Doe的
@I1@
)。這些ID用來連接相關的記錄,如將子女連接到他們的父母。
關鍵概念
- 層次數字:GEDCOM 檔案使用層級數字以分層結構來組織資料。第0級用於頂層記錄(如 INDI、FAM),而第1級及更高級別的記錄用於與特定個人或家庭相關的次級事件或關係。
- 姓名中的斜槓: GEDCOM 中的姓名通常用斜槓括起來,如 John /Doe/,用來區分姓和名。

這是基本的 GEDCOM 檔案示例,但更複雜的檔案可以包括詳細的事件(如婚姻、死亡)、來源(例如人口普查記錄)和多媒體引用。
結論
GEDCOM 一直是家譜領域的基石,使不同家譜軟體平台之間的家譜數據得以交換。 其標準化的格式使研究人員、歷史學者和愛好者能夠有效地分享和保存家族歷史數據。但是,盡管被廣泛採用,GEDCOM 還是有其局限性。如軟體之間的兼容性問題,無法表示復雜的關係,以及缺乏對現代數據類型的支持問題,這顯示出不斷改進或開發新格式的必要性。
隨著科技的不斷進步,家族歷史學也在發展,GEDCOM 的未來可能涉及到對標準的更新,或者開發更好適應現代家譜研究的替代解決方案。目前來說,GEDCOM 仍然是不論是研究員、歷史學家還是業餘家譜愛好者在處理和共享家族數據時的一個重要工具。