آخرین بروز رسانی: 07 فوریه 2025

عنوان - فرمت فایل GEDCOM و FamilySearch

GEDCOM چیست؟

GEDCOM (ارتباط دیتای ژن‌شناسایی) یک فرمت فایل باز طراحی‌شده برای ذخیره، تبادل و به اشتراک‌گذاری داده‌های ژن‌شناسایی (اطلاعات شجره‌نامه خانوادگی) است. این فرمت به طور گسترده در نرم‌افزارها و وب‌سایت‌های ژن‌شناسایی استفاده می‌شود و انتقال راحت‌تر داده‌های شجره‌نامه بین پلتفرم‌های مختلف را ممکن می‌سازد.

تصویری - فرمت فایل GEDCOM و FamilySearch

چه کسی GEDCOM را توسعه داده است؟

GEDCOM توسط کلیسای عیسی مسیح قدیسان آخرالزمان (کلیسای LDS) ایجاد شد که FamilySearch - یک سازمان بزرگ پژوهش ژن‌شناسایی را اداره می‌کند. هدف آن‌ها ساده‌سازی مدیریت داده‌های ژن‌شناسایی و اجازه دادن به همکاری پژوهشی بهتر بود.

GEDCOM چگونه کار می‌کند؟

  • فایل‌های GEDCOM فایل‌های متنی ساده هستند (در حال حاضر با کدگذاری UTF-8 از نسخه 7.0).
  • آن‌ها شامل اطلاعات افراد مانند:
    • نام‌ها
    • تاریخ‌های تولد و مرگ
    • روابط خانوادگی (والدین، فرزندان، همسران)
    • رویدادها (ازدواج، مهاجرت، و غیره)
  • این سوابق از طریق متادیتا پیوسته‌اند، و ارتباطات صحیح بین اعضای خانواده را تضمین می‌کنند.

نسخه‌های GEDCOM و استانداردهای صنعتی

  • آخرین نسخه رسمی GEDCOM 7.0 است که در 2021 منتشر شد.
  • با این حال، GEDCOM 5.5.1 (از 1999، که در 2019 نهایی شد) **به عنوان استاندارد **بیشترین استفاده نمود.
  • به دلیل محدودیت‌های GEDCOM 5.5.1، برخی از توسعه‌دهندگان نرم‌افزارهای ژن‌شناختی پیوست‌های سفارشی مانند GEDCOM 5.5 EL (مکان‌های توسعه‌یافته) را برای بهبود آن ایجاد کردند.

پذیرش GEDCOM 7.0

  • FamilySearch برنامه‌ریزی کرده بود تا تا سه‌ماهه سوم 2022 از GEDCOM 7.0 پشتیبانی کند.
  • Ancestry.com نیز علاقه‌مندی به پذیرش آن نشان داده است، اما تاریخ ثبتی برای پیاده‌سازی آن ارائه نداده است.

چرا GEDCOM مهم است؟

  1. سازگاری بین پلتفرمی – به کاربران اجازه می‌دهد داده‌های شجره‌نامه خود را بین وب‌سایت‌ها و نرم‌افزارهای مختلف جابجا کنند.
  2. ذخیره‌سازی داده بلندمدت – تضمین می‌کند که داده‌های ژن‌شناختی در یک فرمت استاندارد در دسترس باقی می‌مانند.
  3. همکاری ژن‌شناختی – به محققان و تاریخ‌نگاران خانوادگی اجازه می‌دهد تا داده‌ها را به صورت کارآمد به اشتراک بگذارند و ادغام کنند.

توضیح داده مدل GEDCOM

GEDCOM از یک مدل داده پیوسته با نسل‌ها برای سازماندهی روابط خانوادگی به صورت ساختاریافته استفاده می‌کند. این مدل بر اساس مفهوم خانواده هسته‌ای است، به این معنی که روابط را بر اساس والدین و کودکان ثبت می‌کند نه فقط افراد.

اجزای کلیدی مدل داده GEDCOM

  1. سوابق فردی (INDI)

    • هر فرد در فایل ژن‌شناسایی به عنوان یک رکورد INDI (فردی) ذخیره می‌شود.
    • به هر فرد یک شماره شناسه منحصر به فرد اختصاص داده می‌شود تا پیوند صحیح در فایل تضمین گردد.
  2. سوابق خانوادگی (FAM)

    • سوابق خانوادگی (FAM) به عنوان ساختار پیوندی بین افراد عمل می‌کنند.
    • یک سابقه خانوادگی تخصیص می‌دهد:
      • HUSB (شوهر) – پدر خانواده.
      • WIFE (همسر) – مادر در خانواده.
      • CHIL (کودک) – کودکان زوج.
    • این برچسب‌ها تاریخی هستند و بر اساس مدل اصلی GEDCOM تعریف شده‌اند، اما همچنان امروزه استفاده می‌شوند.
تصویری - توضیح داده مدل داده GEDCOM

تکامل نمایش جنسیت در GEDCOM

  • در ابتدا، مدل GEDCOM بر اساس ساختار خانوادگی ناحیه‌نگارانه طراحی شده بود، یعنی جایی که مذکر (HUSB) و مؤنث (WIFE) بچه‌ها را داشته باشند (CHIL).
  • مشخصات GEDCOM 7.0 توضیح داده است که این اصطلاحات به معنای نفی نقش‌های جنسیتی یا والدین بیولوژیکی نیستند.
  • مشخصات به‌روزرسانی‌ شده امکان‌پذیر کرده است:
    • زوج‌های هم‌جنس
    • فرزندخواندگی، پذیرش و همزیستی
    • ساختارهای خانوادگی انعطاف‌پذیرتر
  • ترجیحاً از عبارات همکاران، والدین یا همسران هنگام اشاره به افراد در یک پرونده FAM استفاده می‌شود.
تصویری - توضیح داده مدل داده GEDCOM

چرا این مهم است؟

  1. حفظ روابط ساختاری – اطمینان حاصل می‌کند که هر شخص به درستی به والدین، همسران و فرزندان متصل است.
  2. بهبود سازگاری – به نرم‌افزار ژن‌شناسی امکان می‌دهد داده‌های خانوادگی را به طور کارآمد تشخیص دهد و سازماندهی کند.
  3. افزایش شمول‌پذیری – ساختارهای خانوادگی متنوع را پشتیبانی می‌کند بدون اینکه به نقش‌های جنسی سنتی متکی شود.

توضیح و تشریح ساختار یک فایل GEDCOM

یک فایل GEDCOM از سه بخش اصلی تشکیل شده‌ است: سربرگ، سوابق و تنظیم. هر بخش وظیفه مختص به خود را در سازماندهی داده‌های ژن‌شناختی دارد و ساختار فایل به شدت سازمان‌یافته است تا روابط بین افراد و خانواده‌ها را واضح و استاندارد کند.

1. بخش سربرگ

  • بخش سربرگ شروع فایل GEDCOM را علامت‌گذاری می‌کند و شامل فراداده‌های مهم درباره فایل است، مانند نسخه آن (به عنوان مثال GEDCOM 7.0) و هر تنظیمات یا پیکربندی خاصی برای فایل.
  • این بخش با رکورد HEAD نمایندگی می‌شود.

2. بخش سوابق

این بخش قسمت اصلی فایل GEDCOM است و از چندین نوع رکورد مختلف تشکیل شده است که هرکدام کاربرد خاصی دارند:

  • INDI (رکورد فردی): نمایانگر یک فرد خاص در شجره‌نامه.
  • FAM (رکورد خانوادگی): نشان‌دهنده یک خانواده، به هم پیوسته‌کننده یک شوهر، همسر و فرزندان.
  • SOUR (رکورد منبع): شامل اطلاعات درباره منابع مورد استفاده برای پشتیبانی از داده‌ها، مانند سوابق تاریخی.
  • OBJE (رکورد اشیاء): نمایندگی اشیاء چندرسانه‌ای، مانند عکس‌ها یا اسناد، مربوط به افراد یا خانواده‌ها.
  • NOTE (رکورد یادداشت): شامل توضیحات بیشتر یا یادداشتی است که می‌تواند زمینه یا توضیحات اضافی برای یک رکورد فراهم کند.
  • REPO (رکورد ذخیره‌سازی): توصیف‌کننده یک مکان که اطلاعات ژن‌شناسی در آن ذخیره می‌شود، مانند یک کتابخانه یا آرشیو.
  • SUBM (رکورد ارسال‌کننده): نمایندگی فرد یا نهادی که فایل GEDCOM را ثبت کرده است.

هر یک از این سوابق به ترتیب شده است و اعداد سطح مختلف درجه سطوح مختلف را نشان می‌دهند. به عنوان مثال:

  • سطح 0 برای رکوردهای عالی‌قدر مانند HEAD, TRLR, INDI, FAM, SOUR و غیره.
  • سطح 1 یا بالاتر نماینده سوابق زیرمجموعه، مانند رویدادها یا روابط مربوط به فرد یا خانواده خاصی.

3. بخش انتهایی (TRLR)

  • بخش انتهایی پایان فایل GEDCOM را علامت‌گذاری می‌کند و رکورد TRLR را در خود دارد. این نشان دهنده پایان فایل است.
تصویری - توضیح و تشریح ساختار یک فایل GEDCOM

چگونگی کارکرد عملی آن

  • اعداد سطح: هر خط در یک فایل GEDCOM با یک شماره سطح آغاز می‌شود (مثلاً 0، 1، 2) که در آن 0 نشان‌گر سوابق برتر است و اعداد مثبت (1، 2 و غیره) نشان‌دهنده سوابق تو در تو یا تابع هستند. این سیستم تضمین می‌کند که روابط و سلسله‌مراتب در شجره‌نامه به درستی سازماندهی شوند.

    به عنوان مثال:

    • سطح 0: HEAD (رکورد سربرگ)، TRLR (رکورد تنظیم)، INDI (رکورد فردی)
    • سطح 1: MARR (رویداد ازدواج)، BIRT (رویداد تولد)
    • سطح 2: DATE (تاریخ رویداد)، PLAC (محل رویداد)
  • نوشتن یک فایل GEDCOM به صورت دست نویس از لحاظ فنی ممکن است، اما به دلیل طبیعت ساختاری که دارد، برای انسان دوستانه نیست. استفاده از نرم‌افزارهایی که به منظور کار با فایل‌های GEDCOM طراحی شده‌اند، بسیار آسان‌تر است. این نرم‌افزارها کمک می‌کنند تا داده‌ها به درستی سازمان‌دهی و قالب‌بندی شوند.

اعتبارسنجی و کنترل کیفیت

  • از آنجا که برای استفاده و انتقال صحیح، فایل‌های GEDCOM باید به خوبی سازمان‌دهی شده باشند، ابزارهایی برای اعتبارسنجی خطاها وجود دارد.
    • پروژه PhpGedView: شامل یک اعتبارسنج GEDCOM برای بررسی ساختار است.
    • اعتبارسنج GEDCOM ویندوز: ابزاری مستقل برای اعتبارسنج فایل GEDCOM.
    • Gedcheck: ابزار اعتبارسنجی قدیمی که قبلاً توسط کلیسای LDS استفاده می‌شد.

چالش‌ها با سازگاری GEDCOM

  • در اوایل دهه ۲۰۰۰، پروژه آزمون کتاب GEDCOM ارزیابی کرد که چقدر نرم‌افزارهای مختلف ژن‌شناسی با استاندارد GEDCOM 5.5 سازگار هستند. نتایج نشان‌دهنده چندین مشکل بود، مانند از دست دادن داده‌ها یا خواندن نادرست تگ NOTE که می‌تواند در چندین سطح ظاهر شود.

  • GEDCOM 7.0 به برخی از این مسائل می‌پردازد و ابزارهای اعتبارسنجی برای این نسخه جدیدتر از استاندارد طراحی شده‌اند.

چرا کنترل کیفیت و اعتبارسنجی مهم است؟

  • از آنجا که فایل‌های GEDCOM نیاز به ساختار خوب برای استفاده و انتقال صحیح دارند، ابزارهایی برای اعتبارسنجی آن‌ها به منظور کشف خطاها وجود دارد.
    • این ابزارها کمک می‌کنند تا از از دست دادن داده‌ها هنگام انتقال فایل‌ها بین برنامه‌های ژن‌شناسی جلوگیری شود.
    • آن‌ها به محققان ژن‌شناسی کمک می‌کنند تا اطلاعات را به راحتی میان پلتفرم‌های مختلف به اشتراک بگذارند.

مثال فایل GEDCOM

در اینجا یک مثال ساده از یک فایل GEDCOM آورده شده است، همراه با توضیحات ساختارش:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
1 GEDC
2 VERS 7.0
2 FORM LINEAGE-LINKED
1 CHAR UTF-8
0 @I1@ INDI
1 NAME John /Doe/
2 GIVN John
2 SURN Doe
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 @I2@ INDI
1 NAME Jane /SmitH/
2 GIVN Jane
2 SURN Smith
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 @I3@ INDI
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 @F1@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 TRLR

تحلیل و توضیح:

1. بخش سربرگ (HEAD)

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
  • 0 HEAD: شروع فایل را نشان می‌دهد.
  • 1 SOUR: منبع فایل را مشخص می‌کند (مثلاً FamilySearch GEDCOM).
  • 2 VERS 7.0: نسخه فرمت GEDCOM استفاده‌شده را مشخص می‌کند (در اینجا 7.0).
  • 1 DEST: مقصد یا سیستمی که داده‌ها به آن ارسال می‌شوند را نشان می‌دهد (مانند Ancestry).
  • 1 DATE: تاریخ ایجاد فایل GEDCOM (مثلاً 5 فوریه 2025).
  • 1 SUBM: به رکورد ارسال‌کننده اشاره دارد (@SUBM1@)، که ممکن است اطلاعات بیشتری درباره شخص ارسال‌کننده فایل داشته باشد.

2. سوابق فردی (INDI)

0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
  • 0 INDI @I1@: شروع یک رکورد فردی با یک شناسه منحصر به فرد را نشان می‌دهد (@I1@) برای جان دو.
  • 1 NAME John /Doe/: نام فرد (جان دو).
  • 1 SEX M: جنسیت فرد (مرد - M).
  • 1 BIRT: رویداد تولد فرد را نشان می‌دهد.
    • 2 DATE 1 JAN 1800: تاریخ تولد (اول ژانویه 1800).
    • 2 PLAC New York, USA: محل تولد (نیویورک، آمریکا).

3. رکورد خانوادگی (FAM)

0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
  • 0 FAM @F1@: شروع رکورد خانواده را با یک شناسه منحصر به فرد نشان می‌دهد (@F1@).
  • 1 HUSB @I1@: شوهر (جان دو، ID @I1@) را لینک می‌کند.
  • 1 WIFE @I2@: همسر را متصل می‌کند (جین اسمیت، ID @I2@).
  • 1 CHIL @I3@: کودک را پیوند می‌دهد (مری دو، ID @I3@).

4. دومین رکورد فردی (INDI)

0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
  • 0 INDI @I2@: شروع رکورد فردی جین اسمیت با یک شناسه منحصر به فرد را نشان می‌دهد (@I2@).
  • 1 NAME Jane /Smith/: نام فرد (جین اسمیت).
  • 1 SEX F: جنسیت فرد (زن - F).
  • 1 BIRT: نشان‌دهنده رویداد تولد فرد است.
    • 2 DATE 15 FEB 1805: تاریخ تولد (15 فوریه 1805).
    • 2 PLAC Boston, USA: محل تولد (بوستون، ایالات‌متحده).

5. سومین رکورد فردی (INDI)

0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
  • 0 INDI @I3@: شروع رکورد مری دو به عنوان یک فرد با یک شناسه منحصر به فرد را نشان می‌دهد (@I3@).
  • 1 NAME Mary /Doe/: نام فرد (مری دو).
  • 1 SEX F: جنسیت فرد (زن - F).
  • 1 BIRT: نشان‌دهنده رویداد تولد فرد است.
    • 2 DATE 10 OCT 1825: تاریخ تولد (10 اکتبر 1825).
    • 2 PLAC New York, USA: محل تولد (New York, USA).

6. بخش انتهایی (TRLR)

0 TRLR
  • 0 TRLR: پایان فایل GEDCOM را نشان می‌دهد.

توضیح رکوردهای کلیدی

  • INDI (رکوردهای فردی): این رکوردها شامل جزئیات شخصی در مورد یک فرد خاص، مانند نام، جنسیت و تاریخ تولد است.
  • رکورد خانوادگی (FAM): این رکوردها افراد را برای تشکیل واحدهای خانوادگی متصل می‌کنند. آنها با استفاده از شناسه‌های منحصر به فرد پدر و مادر (HUSB و WIFE) و فرزند (CHIL)، روابط را مشخص می‌کنند.
  • توجه به شناسه‌ها: به هر رکورد (فرد یا خانواده) یک شناسه منحصر به فرد اختصاص داده شده است (به عنوان مثال، @I1@ برای جان دو). این شناسه‌ها برای پیوند دادن افراد مرتبط به کار می‌روند، مانند ارتباط یک کودک با والدینش.

مفاهیم کلیدی

  • شماره سطح‌ها: فایل‌های GEDCOM از شماره‌های سطح برای سازماندهی داده‌ها در یک ساختار سلسله مراتبی استفاده می‌کنند. سطح 0 برای رکوردهای برتر (مانند INDI، FAM) و سطوح 1 و 2 برای جزئیات زیر سطحی (مثل رویدادها و مکان‌ها) به کار می‌روند.
  • نام‌ها در جداسازی: نام‌ها در GEDCOM معمولاً در بین / / قرار می‌گیرند، به طوری که John /Doe/ نام خانوادگی را از نام داده شده متمایز می‌کند.
تصویری - GEDCOM - توضیح توضیحات سوابق کلیدی

این یک فایل ابتدایی GEDCOM است، اما فایل‌های پیچیده‌تر می‌توانند شامل رویدادهای جزئی‌تر (مانند ازدواج‌ها، مرگ‌ومیرها)، منابع (مانند سوابق سرشماری) و مراجع چندرسانه‌ای (مانند عکس‌ها یا اسناد) باشند.

نتیجه‌گیری

GEDCOM به عنوان یک سنگ بنا در زمینه ژن‌شناسی از اهمیت ویژه‌ای برخوردار است و تبادل داده‌های ژن‌شناسی را در سراسر پلتفرم‌های نرم‌افزاری مختلف امکان‌پذیر می‌سازد. فرمت استاندارد آن به محققین، مورخان و علاقه‌مندان کمک کرده است تا داده‌های تاریخچه خانوادگی خود را به طور کارآمد به اشتراک بگذارند و حفظ کنند. با این حال، با وجود پذیرش گسترده‌ای که دارد، GEDCOM بدون محدودیت نیست. مشکلاتی مانند ناسازگاری بین نرم‌افزارها، ناتوانی در نمایش روابط پیچیده و فقدان پشتیبانی از نوع داده‌های مدرن نشان می‌دهد که نیاز به بهبودهای مستمر یا راه‌حل‌های جایگزین وجود دارد.

همانطور که ژن‌شناسی با پیشرفت‌های فناوری ادامه می‌یابد تکامل یابد، ممکن است آینده GEDCOM شامل به‌روز‌رسانی‌هایی برای استاندارد یا توسعه قالب‌های جدیدی باشد که بهتر به پیچیدگی‌های تحقیقات مدرن ژن‌شناختی پاسخ دهد. اما فعلاً، GEDCOM به عنوان ابزاری اساسی برای هر فردی که با شجره‌نامه کار می‌کند، باقی می‌ماند و درک ساختار و کارکرد آن برای مدیریت اطلاعات و به اشتراک‌گذاری مؤثر داده‌ها در جامعه ژن‌شناسی بسیار مهم است.