آخرین بروز رسانی: 07 فوریه 2025

GEDCOM چیست؟
GEDCOM (ارتباط دیتای ژنشناسایی) یک فرمت فایل باز طراحیشده برای ذخیره، تبادل و به اشتراکگذاری دادههای ژنشناسایی (اطلاعات شجرهنامه خانوادگی) است. این فرمت به طور گسترده در نرمافزارها و وبسایتهای ژنشناسایی استفاده میشود و انتقال راحتتر دادههای شجرهنامه بین پلتفرمهای مختلف را ممکن میسازد.

چه کسی GEDCOM را توسعه داده است؟
GEDCOM توسط کلیسای عیسی مسیح قدیسان آخرالزمان (کلیسای LDS) ایجاد شد که FamilySearch - یک سازمان بزرگ پژوهش ژنشناسایی را اداره میکند. هدف آنها سادهسازی مدیریت دادههای ژنشناسایی و اجازه دادن به همکاری پژوهشی بهتر بود.
GEDCOM چگونه کار میکند؟
- فایلهای GEDCOM فایلهای متنی ساده هستند (در حال حاضر با کدگذاری UTF-8 از نسخه 7.0).
- آنها شامل اطلاعات افراد مانند:
- نامها
- تاریخهای تولد و مرگ
- روابط خانوادگی (والدین، فرزندان، همسران)
- رویدادها (ازدواج، مهاجرت، و غیره)
- این سوابق از طریق متادیتا پیوستهاند، و ارتباطات صحیح بین اعضای خانواده را تضمین میکنند.
نسخههای GEDCOM و استانداردهای صنعتی
- آخرین نسخه رسمی GEDCOM 7.0 است که در 2021 منتشر شد.
- با این حال، GEDCOM 5.5.1 (از 1999، که در 2019 نهایی شد) **به عنوان استاندارد **بیشترین استفاده نمود.
- به دلیل محدودیتهای GEDCOM 5.5.1، برخی از توسعهدهندگان نرمافزارهای ژنشناختی پیوستهای سفارشی مانند GEDCOM 5.5 EL (مکانهای توسعهیافته) را برای بهبود آن ایجاد کردند.
پذیرش GEDCOM 7.0
- FamilySearch برنامهریزی کرده بود تا تا سهماهه سوم 2022 از GEDCOM 7.0 پشتیبانی کند.
- Ancestry.com نیز علاقهمندی به پذیرش آن نشان داده است، اما تاریخ ثبتی برای پیادهسازی آن ارائه نداده است.
چرا GEDCOM مهم است؟
- سازگاری بین پلتفرمی – به کاربران اجازه میدهد دادههای شجرهنامه خود را بین وبسایتها و نرمافزارهای مختلف جابجا کنند.
- ذخیرهسازی داده بلندمدت – تضمین میکند که دادههای ژنشناختی در یک فرمت استاندارد در دسترس باقی میمانند.
- همکاری ژنشناختی – به محققان و تاریخنگاران خانوادگی اجازه میدهد تا دادهها را به صورت کارآمد به اشتراک بگذارند و ادغام کنند.
توضیح داده مدل GEDCOM
GEDCOM از یک مدل داده پیوسته با نسلها برای سازماندهی روابط خانوادگی به صورت ساختاریافته استفاده میکند. این مدل بر اساس مفهوم خانواده هستهای است، به این معنی که روابط را بر اساس والدین و کودکان ثبت میکند نه فقط افراد.
اجزای کلیدی مدل داده GEDCOM
سوابق فردی (INDI)
- هر فرد در فایل ژنشناسایی به عنوان یک رکورد INDI (فردی) ذخیره میشود.
- به هر فرد یک شماره شناسه منحصر به فرد اختصاص داده میشود تا پیوند صحیح در فایل تضمین گردد.
سوابق خانوادگی (FAM)
- سوابق خانوادگی (FAM) به عنوان ساختار پیوندی بین افراد عمل میکنند.
- یک سابقه خانوادگی تخصیص میدهد:
- HUSB (شوهر) – پدر خانواده.
- WIFE (همسر) – مادر در خانواده.
- CHIL (کودک) – کودکان زوج.
- این برچسبها تاریخی هستند و بر اساس مدل اصلی GEDCOM تعریف شدهاند، اما همچنان امروزه استفاده میشوند.

تکامل نمایش جنسیت در GEDCOM
- در ابتدا، مدل GEDCOM بر اساس ساختار خانوادگی ناحیهنگارانه طراحی شده بود، یعنی جایی که مذکر (HUSB) و مؤنث (WIFE) بچهها را داشته باشند (CHIL).
- مشخصات GEDCOM 7.0 توضیح داده است که این اصطلاحات به معنای نفی نقشهای جنسیتی یا والدین بیولوژیکی نیستند.
- مشخصات بهروزرسانی شده امکانپذیر کرده است:
- زوجهای همجنس
- فرزندخواندگی، پذیرش و همزیستی
- ساختارهای خانوادگی انعطافپذیرتر
- ترجیحاً از عبارات همکاران، والدین یا همسران هنگام اشاره به افراد در یک پرونده FAM استفاده میشود.

چرا این مهم است؟
- حفظ روابط ساختاری – اطمینان حاصل میکند که هر شخص به درستی به والدین، همسران و فرزندان متصل است.
- بهبود سازگاری – به نرمافزار ژنشناسی امکان میدهد دادههای خانوادگی را به طور کارآمد تشخیص دهد و سازماندهی کند.
- افزایش شمولپذیری – ساختارهای خانوادگی متنوع را پشتیبانی میکند بدون اینکه به نقشهای جنسی سنتی متکی شود.
توضیح و تشریح ساختار یک فایل GEDCOM
یک فایل GEDCOM از سه بخش اصلی تشکیل شده است: سربرگ، سوابق و تنظیم. هر بخش وظیفه مختص به خود را در سازماندهی دادههای ژنشناختی دارد و ساختار فایل به شدت سازمانیافته است تا روابط بین افراد و خانوادهها را واضح و استاندارد کند.
1. بخش سربرگ
- بخش سربرگ شروع فایل GEDCOM را علامتگذاری میکند و شامل فرادادههای مهم درباره فایل است، مانند نسخه آن (به عنوان مثال GEDCOM 7.0) و هر تنظیمات یا پیکربندی خاصی برای فایل.
- این بخش با رکورد HEAD نمایندگی میشود.
2. بخش سوابق
این بخش قسمت اصلی فایل GEDCOM است و از چندین نوع رکورد مختلف تشکیل شده است که هرکدام کاربرد خاصی دارند:
- INDI (رکورد فردی): نمایانگر یک فرد خاص در شجرهنامه.
- FAM (رکورد خانوادگی): نشاندهنده یک خانواده، به هم پیوستهکننده یک شوهر، همسر و فرزندان.
- SOUR (رکورد منبع): شامل اطلاعات درباره منابع مورد استفاده برای پشتیبانی از دادهها، مانند سوابق تاریخی.
- OBJE (رکورد اشیاء): نمایندگی اشیاء چندرسانهای، مانند عکسها یا اسناد، مربوط به افراد یا خانوادهها.
- NOTE (رکورد یادداشت): شامل توضیحات بیشتر یا یادداشتی است که میتواند زمینه یا توضیحات اضافی برای یک رکورد فراهم کند.
- REPO (رکورد ذخیرهسازی): توصیفکننده یک مکان که اطلاعات ژنشناسی در آن ذخیره میشود، مانند یک کتابخانه یا آرشیو.
- SUBM (رکورد ارسالکننده): نمایندگی فرد یا نهادی که فایل GEDCOM را ثبت کرده است.
هر یک از این سوابق به ترتیب شده است و اعداد سطح مختلف درجه سطوح مختلف را نشان میدهند. به عنوان مثال:
- سطح 0 برای رکوردهای عالیقدر مانند HEAD, TRLR, INDI, FAM, SOUR و غیره.
- سطح 1 یا بالاتر نماینده سوابق زیرمجموعه، مانند رویدادها یا روابط مربوط به فرد یا خانواده خاصی.
3. بخش انتهایی (TRLR)
- بخش انتهایی پایان فایل GEDCOM را علامتگذاری میکند و رکورد TRLR را در خود دارد. این نشان دهنده پایان فایل است.

چگونگی کارکرد عملی آن
اعداد سطح: هر خط در یک فایل GEDCOM با یک شماره سطح آغاز میشود (مثلاً 0، 1، 2) که در آن 0 نشانگر سوابق برتر است و اعداد مثبت (1، 2 و غیره) نشاندهنده سوابق تو در تو یا تابع هستند. این سیستم تضمین میکند که روابط و سلسلهمراتب در شجرهنامه به درستی سازماندهی شوند.
به عنوان مثال:
- سطح 0: HEAD (رکورد سربرگ)، TRLR (رکورد تنظیم)، INDI (رکورد فردی)
- سطح 1: MARR (رویداد ازدواج)، BIRT (رویداد تولد)
- سطح 2: DATE (تاریخ رویداد)، PLAC (محل رویداد)
نوشتن یک فایل GEDCOM به صورت دست نویس از لحاظ فنی ممکن است، اما به دلیل طبیعت ساختاری که دارد، برای انسان دوستانه نیست. استفاده از نرمافزارهایی که به منظور کار با فایلهای GEDCOM طراحی شدهاند، بسیار آسانتر است. این نرمافزارها کمک میکنند تا دادهها به درستی سازماندهی و قالببندی شوند.
اعتبارسنجی و کنترل کیفیت
- از آنجا که برای استفاده و انتقال صحیح، فایلهای GEDCOM باید به خوبی سازماندهی شده باشند، ابزارهایی برای اعتبارسنجی خطاها وجود دارد.
- پروژه PhpGedView: شامل یک اعتبارسنج GEDCOM برای بررسی ساختار است.
- اعتبارسنج GEDCOM ویندوز: ابزاری مستقل برای اعتبارسنج فایل GEDCOM.
- Gedcheck: ابزار اعتبارسنجی قدیمی که قبلاً توسط کلیسای LDS استفاده میشد.
چالشها با سازگاری GEDCOM
در اوایل دهه ۲۰۰۰، پروژه آزمون کتاب GEDCOM ارزیابی کرد که چقدر نرمافزارهای مختلف ژنشناسی با استاندارد GEDCOM 5.5 سازگار هستند. نتایج نشاندهنده چندین مشکل بود، مانند از دست دادن دادهها یا خواندن نادرست تگ NOTE که میتواند در چندین سطح ظاهر شود.
GEDCOM 7.0 به برخی از این مسائل میپردازد و ابزارهای اعتبارسنجی برای این نسخه جدیدتر از استاندارد طراحی شدهاند.
چرا کنترل کیفیت و اعتبارسنجی مهم است؟
- از آنجا که فایلهای GEDCOM نیاز به ساختار خوب برای استفاده و انتقال صحیح دارند، ابزارهایی برای اعتبارسنجی آنها به منظور کشف خطاها وجود دارد.
- این ابزارها کمک میکنند تا از از دست دادن دادهها هنگام انتقال فایلها بین برنامههای ژنشناسی جلوگیری شود.
- آنها به محققان ژنشناسی کمک میکنند تا اطلاعات را به راحتی میان پلتفرمهای مختلف به اشتراک بگذارند.
مثال فایل GEDCOM
در اینجا یک مثال ساده از یک فایل GEDCOM آورده شده است، همراه با توضیحات ساختارش:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
1 GEDC
2 VERS 7.0
2 FORM LINEAGE-LINKED
1 CHAR UTF-8
0 @I1@ INDI
1 NAME John /Doe/
2 GIVN John
2 SURN Doe
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 @I2@ INDI
1 NAME Jane /SmitH/
2 GIVN Jane
2 SURN Smith
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 @I3@ INDI
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 @F1@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 TRLR
تحلیل و توضیح:
1. بخش سربرگ (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: شروع فایل را نشان میدهد.
- 1 SOUR: منبع فایل را مشخص میکند (مثلاً FamilySearch GEDCOM).
- 2 VERS 7.0: نسخه فرمت GEDCOM استفادهشده را مشخص میکند (در اینجا 7.0).
- 1 DEST: مقصد یا سیستمی که دادهها به آن ارسال میشوند را نشان میدهد (مانند Ancestry).
- 1 DATE: تاریخ ایجاد فایل GEDCOM (مثلاً 5 فوریه 2025).
- 1 SUBM: به رکورد ارسالکننده اشاره دارد (@SUBM1@)، که ممکن است اطلاعات بیشتری درباره شخص ارسالکننده فایل داشته باشد.
2. سوابق فردی (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: شروع یک رکورد فردی با یک شناسه منحصر به فرد را نشان میدهد (@I1@) برای جان دو.
- 1 NAME John /Doe/: نام فرد (جان دو).
- 1 SEX M: جنسیت فرد (مرد - M).
- 1 BIRT: رویداد تولد فرد را نشان میدهد.
- 2 DATE 1 JAN 1800: تاریخ تولد (اول ژانویه 1800).
- 2 PLAC New York, USA: محل تولد (نیویورک، آمریکا).
3. رکورد خانوادگی (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: شروع رکورد خانواده را با یک شناسه منحصر به فرد نشان میدهد (@F1@).
- 1 HUSB @I1@: شوهر (جان دو، ID @I1@) را لینک میکند.
- 1 WIFE @I2@: همسر را متصل میکند (جین اسمیت، ID @I2@).
- 1 CHIL @I3@: کودک را پیوند میدهد (مری دو، ID @I3@).
4. دومین رکورد فردی (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: شروع رکورد فردی جین اسمیت با یک شناسه منحصر به فرد را نشان میدهد (@I2@).
- 1 NAME Jane /Smith/: نام فرد (جین اسمیت).
- 1 SEX F: جنسیت فرد (زن - F).
- 1 BIRT: نشاندهنده رویداد تولد فرد است.
- 2 DATE 15 FEB 1805: تاریخ تولد (15 فوریه 1805).
- 2 PLAC Boston, USA: محل تولد (بوستون، ایالاتمتحده).
5. سومین رکورد فردی (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: شروع رکورد مری دو به عنوان یک فرد با یک شناسه منحصر به فرد را نشان میدهد (@I3@).
- 1 NAME Mary /Doe/: نام فرد (مری دو).
- 1 SEX F: جنسیت فرد (زن - F).
- 1 BIRT: نشاندهنده رویداد تولد فرد است.
- 2 DATE 10 OCT 1825: تاریخ تولد (10 اکتبر 1825).
- 2 PLAC New York, USA: محل تولد (New York, USA).
6. بخش انتهایی (TRLR)
0 TRLR
- 0 TRLR: پایان فایل GEDCOM را نشان میدهد.
توضیح رکوردهای کلیدی
- INDI (رکوردهای فردی): این رکوردها شامل جزئیات شخصی در مورد یک فرد خاص، مانند نام، جنسیت و تاریخ تولد است.
- رکورد خانوادگی (FAM): این رکوردها افراد را برای تشکیل واحدهای خانوادگی متصل میکنند. آنها با استفاده از شناسههای منحصر به فرد پدر و مادر (HUSB و WIFE) و فرزند (CHIL)، روابط را مشخص میکنند.
- توجه به شناسهها: به هر رکورد (فرد یا خانواده) یک شناسه منحصر به فرد اختصاص داده شده است (به عنوان مثال،
@I1@
برای جان دو). این شناسهها برای پیوند دادن افراد مرتبط به کار میروند، مانند ارتباط یک کودک با والدینش.
مفاهیم کلیدی
- شماره سطحها: فایلهای GEDCOM از شمارههای سطح برای سازماندهی دادهها در یک ساختار سلسله مراتبی استفاده میکنند. سطح 0 برای رکوردهای برتر (مانند INDI، FAM) و سطوح 1 و 2 برای جزئیات زیر سطحی (مثل رویدادها و مکانها) به کار میروند.
- نامها در جداسازی: نامها در GEDCOM معمولاً در بین / / قرار میگیرند، به طوری که John /Doe/ نام خانوادگی را از نام داده شده متمایز میکند.

این یک فایل ابتدایی GEDCOM است، اما فایلهای پیچیدهتر میتوانند شامل رویدادهای جزئیتر (مانند ازدواجها، مرگومیرها)، منابع (مانند سوابق سرشماری) و مراجع چندرسانهای (مانند عکسها یا اسناد) باشند.
نتیجهگیری
GEDCOM به عنوان یک سنگ بنا در زمینه ژنشناسی از اهمیت ویژهای برخوردار است و تبادل دادههای ژنشناسی را در سراسر پلتفرمهای نرمافزاری مختلف امکانپذیر میسازد. فرمت استاندارد آن به محققین، مورخان و علاقهمندان کمک کرده است تا دادههای تاریخچه خانوادگی خود را به طور کارآمد به اشتراک بگذارند و حفظ کنند. با این حال، با وجود پذیرش گستردهای که دارد، GEDCOM بدون محدودیت نیست. مشکلاتی مانند ناسازگاری بین نرمافزارها، ناتوانی در نمایش روابط پیچیده و فقدان پشتیبانی از نوع دادههای مدرن نشان میدهد که نیاز به بهبودهای مستمر یا راهحلهای جایگزین وجود دارد.
همانطور که ژنشناسی با پیشرفتهای فناوری ادامه مییابد تکامل یابد، ممکن است آینده GEDCOM شامل بهروزرسانیهایی برای استاندارد یا توسعه قالبهای جدیدی باشد که بهتر به پیچیدگیهای تحقیقات مدرن ژنشناختی پاسخ دهد. اما فعلاً، GEDCOM به عنوان ابزاری اساسی برای هر فردی که با شجرهنامه کار میکند، باقی میماند و درک ساختار و کارکرد آن برای مدیریت اطلاعات و به اشتراکگذاری مؤثر دادهها در جامعه ژنشناسی بسیار مهم است.