最終更新日: 2025年2月7日

タイトル - GEDCOMファイル形式とFamilySearch

GEDCOMとは何か?

GEDCOM (Genealogical Data Communication) は、系譜データの格納、交換、共有のために設計されたオープンファイル形式です。これは歴史ソフトウェアやウェブサイトで広く使用されており、異なるプラットフォーム間で家系図データを転送しやすくしています。

イラスト - GEDCOMファイル形式とFamilySearch

誰がGEDCOMを開発したのか?

GEDCOMは、主要な系譜研究組織であるFamilySearchを運営する末日聖徒イエス・キリスト教会 (LDS教会)によって作成されました。彼らの目標は、系譜データ管理を簡素化し、より良い研究協力を可能にすることでした。

GEDCOMの仕組み

  • GEDCOMファイルはプレーンテキストファイルです(バージョン7.0からはUTF-8エンコーディングを使用)。
  • それらは個人に関する情報を含んでいます。例えば:
    • 名前
    • 出生日と死亡日
    • 家族関係(両親、子供、配偶者)
    • イベント(結婚、移民など)
  • これらの記録はメタデータを使ってリンクされており、家族メンバー間の適切なつながりを保証します。

GEDCOMのバージョンと業界標準

  • 最新の正式なバージョンは2021年にリリースされた GEDCOM 7.0です。
  • しかし、GEDCOM 5.5.1(1999年に登場、2019年に最終化)が最も広く使用されている標準です。
  • GEDCOM 5.5.1には制限があるため、いくつかの系譜ソフトウェア開発者は、GEDCOM 5.5 EL(拡張場所)のようなカスタム拡張を作成しました。

GEDCOM 7.0の採用

  • FamilySearch は、2022年第3四半期までにGEDCOM 7.0のサポートを計画していました。
  • Ancestry.com も採用に関心を示していますが、確定的な実装日程は提供していません。

なぜGEDCOMは重要か?

  1. クロスプラットフォーム互換性 – ユーザーは異なる系譜ウェブサイトやソフトウェア間で家系図データを移動できます。
  2. 長期データ保存 – 系譜データが標準化された形式でアクセス可能であることを保証します。
  3. 系譜協力 – 研究者や家系歴史家がデータを効率的に共有し、統合できるようにします。

GEDCOMデータモデルの説明

GEDCOMは、系譜関係を構造化された方法で整理するための家系連結データモデルを使用しています。これは核家族の概念に基づいており、個々の人物ではなく、親と子供の関係を記録します。

GEDCOMデータモデルの主要コンポーネント

  1. INDI(個人)記録

    • 系譜ファイル内の各人はINDI(個人)記録として格納されます。
    • 各個人にはファイル内での適切なリンクを保証するためにユニークID番号が割り当てられています。
  2. FAM(家族)記録

    • 家族記録(FAM)は個人間の連結構造として機能します。
    • FAM記録は以下を割り当てます:
      • HUSB(夫) – 家族の父親。
      • WIFE(妻) – 家族の母親。
      • CHIL(子供) – 夫婦の子供。
    • これらのラベルは歴史的で、元のGEDCOMモデルに基づいたものですが、今日でも使用されています。
イラスト - GEDCOMデータモデルの説明

GEDCOMにおけるジェンダー表現の進化

  • 初めは、GEDCOMモデルは異性愛家族構造を想定して設計されており、男性(HUSB)と女性(WIFE)が子供(CHIL)をもつという形でした。
  • GEDCOM 7.0の仕様 では、これらの用語がジェンダーの役割や生物学的親を意味するものではないと明確にされています。
  • 更新された仕様により、以下が可能になりました:
    • 同性カップル
    • 養子縁組、里親、同棲
    • より柔軟な家族構造
  • FAM記録内で個人を表す際、現在は**「パートナー」、「親」、「配偶者」**という用語が好まれています。
イラスト - GEDCOMデータモデルの説明

なぜこれが重要なのか?

  1. 構造化された関係を維持 – 各個人が正確に親、配偶者、子供に結びつけられることを保証。
  2. 互換性の向上 – 系譜ソフトウェアが家系データを効率的に認識・整理できる。
  3. 包括性の強化 – 伝統的なジェンダーの役割を前提とせず、多様な家族構造をサポートする。

GEDCOMファイルの構造の説明

GEDCOMファイルは、ヘッダー記録トレーラー3つの主要セクションで構成されています。各セクションは特定の役割を果たし、系譜データを整理しており、個人や家族間の関係が明確かつ標準化されていることを保証します。

1. ヘッダーセクション

  • ヘッダーセクションはGEDCOMファイルの開始を示し、ファイル自体に関する重要なメタデータを含みます。バージョン(例:GEDCOM 7.0)やファイルの特別な設定や構成が記されています。
  • このセクションはHEAD記録で表されます。

2. 記録セクション

これはGEDCOMファイルの主要部分で、各種の記録タイプがあり、それぞれが特定の目的を持っています:

  • INDI(個人記録): 家系図内の個人を表します。
  • FAM(家族記録): 家族を表し、夫、妻、子供をリンクします。
  • SOUR(資料記録): 歴史的な記録のように、データをサポートするために使用された情報を含んでいます。
  • OBJE(オブジェクト記録): 写真や文書のようなマルチメディアオブジェクトを表し、個人や家族に関連付けられます。
  • NOTE(メモ記録): 記録の文脈や説明を追加するためのメモやコメントを含んでいます。
  • REPO(リポジトリ記録): 図書館やアーカイブのような、系譜情報が保存されている場所を説明します。
  • SUBM(提出者記録): GEDCOMファイルを提出する個人または団体を表します。

これらの記録は階層的に構造化されており、異なるレベル番号がデータの関連性を示します。例えば:

  • レベル0は、最も重要な記録のトップレベルで、HEAD, TRLR, INDI, FAM, SOURなどがあります。
  • レベル1以上は、特定の個人や家族に関連付けられたイベントや関係のサブレベル記録を表します。

3. トレーラーセクション

  • トレーラーセクションはGEDCOMファイルの終わりを示し、TRLR記録を含んでいます。これによってファイルが終了したことを示します。
イラスト - GEDCOMファイル構造の説明

実際の動作

  • レベル番号: GEDCOMファイルの各行はレベル番号(例:0, 1, 2)で始まり、レベル0最上位の記録 (例:HEAD, TRLR, INDI, FAM, SOURなど)、正の整数(1, 2, など) は特定の個人や家族に関連付けられたネストされたまたは下位の記録を表します。このシステムは、家系図内の関係と階層を適切に整理することを保証します。

    例えば:

    • レベル0: HEAD(ヘッダー記録)、TRLR(トレーラー記録)、INDI(個人記録)
    • レベル1: MARR(結婚イベント)、BIRT(出生イベント)
    • レベル2: DATE(イベントの日付)、PLAC(イベントの場所)
  • GEDCOMファイルを手書きすることは技術的に可能ですが、構造的な性質のため人間には扱いにくいのが一般的です。GEDCOMファイル用に設計されたソフトウェアを使用する方がはるかに簡単であり、データの正しい整理やフォーマットを助けます。

バリデーションと品質管理

  • GEDCOMファイルが正確に構造化され、適切に使用・転送されるためには、誤りを検証するツールが必要です。
    • PhpGedView プロジェクト: GEDCOMの構造をチェックするための検証ツールを含んでいます。
    • The Windows GEDCOM Validator: GEDCOMの検証を行うためのスタンドアロンツールです。
    • Gedcheck: LDS教会によって以前使用されていた古い検証ツールです。

GEDCOM互換性に関する課題

  • 2000年代初頭、GEDCOM TestBookプロジェクトは、さまざまな系譜ソフトウェアがGEDCOM 5.5標準にどの程度準拠しているかを評価しました。結果、データ喪失や複数レベルにおけるNOTEタグの不適切な読み取りのようないくつかの問題が明らかになりました。

  • GEDCOM 7.0は、これらの問題の一部を解決することを目指しており、この新しいバージョンのための検証ツールが提供されています。

GEDCOMファイルの互換性の課題

  • 2000年代初頭、GEDCOM TestBookプロジェクトが、さまざまな系譜ソフトウェアがGEDCOM 5.5標準にどの程度準拠しているかを評価しました。その結果、データの損失や、複数レベルで出現する NOTEタグ の不正解読など、いくつかの課題が明らかになりました。

  • GEDCOM 7.0は、これらの問題の一部に対処することを目的としており、この新しい標準のための検証ツールも開発されています。

  • GEDCOMファイルの検証と品質管理

    • GEDCOMファイルは、正しく利用し転送するために、構造が整っている必要があるため、誤りを検証するためのツールが存在します。
      • PhpGedView Project: GEDCOMの構造をチェックするためのGEDCOM検証ツールを含みます。
      • The Windows GEDCOM Validator: GEDCOMファイルを検証するためのスタンドアロンツールです。
      • Gedcheck: 構造を評価するためにLDS教会により以前使用された古い検証ツールです。

GEDCOMの互換性に関する課題

  • 2000年代初頭、GEDCOM TestBook Projectでは、さまざまな系譜ソフトウェアがGEDCOM 5.5標準にどの程度準拠しているか評価し、データの損失や、特定のタグ(例:NOTEタグ)の不適切な読み取りなど、いくつかの課題が明らかになりました。

  • GEDCOM 7.0は、これらの問題の一部を解決することを目指しており、この新しい標準の 検証ツールも存在し、異なるプラットフォーム間の互換性を保証する助けになっています。

なぜGEDCOMの検証が重要なのか?

  • データが正しく構造化されていること、また個々のデータ、家族、イベント、情報源間の関係が適切に維持されていることを保証します。
  • 系譜プログラム間でファイルを転送する際のデータ損失を防ぐ助けとなります。
  • 系譜学者が異なるプラットフォーム間で情報を簡単に共有できるようにします

サンプルGEDCOMファイル

以下は、簡単なGEDCOMファイルの例と、その構造の説明です:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR

区分と説明:

1. ヘッダーセクション (HEAD)

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
  • 0 HEAD: ファイルの開始を示します。
  • 1 SOUR: ファイルのソースを示します(例: FamilySearch GEDCOM)。
  • 2 VERS 7.0: 使用されたGEDCOM形式のバージョンを指定します(ここでは7.0)。
  • 1 DEST: データの送信先システム(例: Ancestry)。
  • 1 DATE: GEDCOMファイルが作成された日付(例: 2025年2月5日)。
  • 1 SUBM: ファイルを提出する人物または団体の情報を含む提出者記録 参照(@SUBM1@)。

2. 個人記録 (INDI)

0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
  • 0 INDI @I1@: John Doeに割り当てられたユニークなID(@I1@)を持つ個人記録の開始を示します。
  • 1 NAME John /Doe/: 個人の名前(John Doe)。
  • 1 SEX M: 個人の性別(Mは男性を示す)。
  • 1 BIRT: 個人の出生イベント。
    • 2 DATE 1 JAN 1800: 出生日(1800年1月1日)。
    • 2 PLAC New York, USA: 出生地(米国ニューヨーク)。

3. 家族記録 (FAM)

0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
  • 0 FAM @F1@: ユニークID (@F1@) を持つ家族記録の開始を示します。
  • 1 HUSB @I1@: 夫をリンク(John Doe, ID @I1@)。
  • 1 WIFE @I2@: 妻をリンク(Jane Smith, ID @I2@)。
  • 1 CHIL @I3@: 子供をリンク(Mary Doe, ID @I3@)。

4. 二つ目の個人記録 (INDI)

0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
  • 0 INDI @I2@: ユニークID (@I2@) を持つJane Smithの個人記録の開始を示します。
  • 1 NAME Jane /Smith/: 個人の名前(Jane Smith)。
  • 1 SEX F: 個人の性別(Fは女性を示す)。
  • 1 BIRT: 個人の出生イベント。
    • 2 DATE 15 FEB 1805: 出生日(1805年2月15日)。
    • 2 PLAC Boston, USA: 出生地(Boston, USA)。

5. 三番目の個人記録 (INDI)

0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
  • 0 INDI @I3@: ユニークID (@I3@) を持つMary Doeの個人記録の開始を示します。
  • 1 NAME Mary /Doe/: 個人の名前(Mary Doe)。
  • 1 SEX F: 個人の性別(Fは女性を示す)。
  • 1 BIRT: 個人の出生イベント。
    • 2 DATE 10 OCT 1825: 出生日(1825年10月10日)。
    • 2 PLAC New York, USA: 出生地(New York, USA)。

6. トレーラーセクション (TRLR)

0 TRLR
  • 0 TRLR: GEDCOMファイルの終了を示します。

重要な記録の説明

  • INDI(個人)記録:これらは、特定の個人に関する個人情報(名前、性別、誕生日など)を含んでいます。
  • FAM(家族)記録:これにより、個人が家族単位でリンクされます。これにより、親(HUSBとWIFE)、子供(CHIL)をそれぞれのユニークIDでつなぎます。
  • IDについての注意:各記録(個人または家族)には、ユニークなID (例:@I1@) が割り当てられており、関連する記録をリンクするために使用されます。

キーポイント

  • レベル番号: GEDCOMファイルは、階層構造でデータを整理するためにレベル番号を使用します。レベル0トップレベルの記録(INDI、FAMなど)で、レベル1および2は特定の個人や家族に結びつく詳細(イベントや場所など)を表します。
  • スラッシュ内の名前:GEDCOMの名前はしばしばスラッシュで囲まれており、たとえば John /Doe/ は名と姓を区別します。
イラスト - GEDCOM - 主要な記録の説明

これは基本的なGEDCOMファイルの例ですが、より複雑なファイルでは、詳細なイベント(結婚や死亡など)、情報源(例、人口調査の記録)、およびマルチメディア参照を含むことができます。

結論

GEDCOMは系譜学の分野において柱となっており、さまざまなソフトウェアプラットフォーム間での系譜データの交換を可能にしてきました。この標準化された形式のおかげで、研究者、歴史家、家族歴史ファンたちはデータを効率的に共有し、保存することができるようになりました。しかし、広く採用されているにもかかわらず、GEDCOMにはまだ限界があります。ソフトウェア間の互換性の問題や、複雑な関係を表現する力の不足、現代のデータタイプをよりよく扱うための更新や代替ソリューションの開発の必要性が挙げられます。

系譜学が技術の進化とともに発展を続ける中、GEDCOMの未来は変わりゆく系譜研究の複雑さをよりよく対応するための標準の更新や新しい形式の開発を含むかもしれません。現時点で、GEDCOMは家系図の作成に取り組むすべての人にとって不可欠なツールであり、その構造と機能を理解することは、遺伝データの効果的な管理と共有にとって重要です。