עודכן לאחרונה: 07 Feb, 2025

כותרת - GEDCOM File Format and FamilySearch

מהו GEDCOM?

GEDCOM (Genealogical Data Communication) הוא פורמט קובץ פתוח שנועד לאחסן, להחליף ולשתף נתוני גנאולוגיה (מידע על עצי משפחה). הוא נפוץ בתוכנות ובאתרי גנאולוגיה, מה שמקל על העברת נתוני עצי משפחה בין פלטפורמות שונות.

אילוסטרציה - GEDCOM File Format and FamilySearch

מי פיתח את GEDCOM?

GEDCOM נוצר על ידי הכנסייה של ישוע המשיח של קדושי היום האחרון (LDS Church), שמפעילה את FamilySearch—ארגון מחקר גנאולוגי מרכזי. מטרתם הייתה לפשט את ניהול נתוני הגנאולוגיה ולאפשר שיתוף פעולה במחקר טוב יותר.

איך GEDCOM עובד?

  • קבצי GEDCOM הם קבצי טקסט פשוטים (כעת משתמשים בקידוד UTF-8 החל מגרסה 7.0).
  • הם מכילים מידע על יחידים, כגון:
    • שמות
    • תאריכי לידה ומוות
    • קשרים משפחתיים (הורים, ילדים, בני זוג)
    • אירועים (נישואין, הגירה, וכד')
  • רשומות אלו מקושרות באמצעות מטא‑דאטה, מה שמבטיח חיבורים נכונים בין בני המשפחה.

גרסאות GEDCOM ותקני תעשייה

  • הגרסה הרשמית האחרונה היא GEDCOM 7.0, שפורסמה ב2021.
  • עם זאת, GEDCOM 5.5.1 (מ‑1999, סופקה ב‑2019)** נשארת התקן הנפוץ ביותר.
  • מאחר של‑GEDCOM 5.5.1 היו מגבלות, כמה מפתחי תוכנות גנאולוגיה יצרו הרחבות מותאמות כגון GEDCOM 5.5 EL (מיקומים מורחבים) לשיפורו.

אימוץ GEDCOM 7.0

  • FamilySearch תכננה לתמוך ב‑GEDCOM 7.0 עד Q3 2022.
  • Ancestry.com גם הוא הביע עניין באימוץ, אך לא סיפק תאריך יישום קבוע.

למה GEDCOM חשוב?

  1. תאימות בין פלטפורמות – מאפשרת למשתמשים להעביר את נתוני עצי המשפחה שלהם בין אתרי גנאולוגיה ותוכנות שונים.
  2. אחסון נתונים לטווח ארוך – מבטיח שנתוני הגנאולוגיה יישארו נגישים בפורמט סטנדרטי.
  3. שיתוף פעולה בגנאולוגיה – מאפשר לחוקרים והיסטוריוני משפחה לשתף ולמזג נתונים ביעילות.

הסבר על מודל הנתונים של GEDCOM

GEDCOM משתמש במודל נתונים מקושר בירושה כדי לארגן קשרים משפחתיים בצורה מובנית. הוא מבוסס על מושג המשפחה הגרעינית, כלומר הוא מתעד קשרים במונחי הורים וילדים ולא רק יחידים.

רכיבים מרכזיים של מודל הנתונים של GEDCOM

  1. INDI (Individual) Records

    • כל אדם בקובץ הגנאולוגיה נשמר כהרשומה INDI (אינדיבידואל).
    • לכל אינדיבידואל מוקצה מספר זיהוי ייחודי כדי להבטיח קישור נכון בקובץ.
  2. FAM (Family) Records

    • רשומות משפחה (FAM) משמשות כמבנה הקישור בין אינדיבידואלים.
    • רשומת FAM מגדירה:
      • HUSB (בעל) – האב במשפחה.
      • WIFE (אישה) – האם במשפחה.
      • CHIL (ילד) – הילדים של הזוג.
    • תוויות אלו הן היסטוריות ומבוססות על מודל GEDCOM המקורי אך עדיין משמשות היום.
אילוסטרציה - הסבר על מודל הנתונים של GEDCOM

התפתחות ייצוג המגדר ב‑GEDCOM

  • במקור, מודל GEDCOM תוכנן בהנחה של מבנה משפחה הטרונורמטיבי, שבו זכר (HUSB) ונקבה (WIFE) יש להם ילדים (CHIL).
  • המפרט GEDCOM 7.0 מבהיר שמונחים אלו אינם מרמזים על תפקידי מגדר או הורות ביולוגית.
  • המפרט המעודכן מאפשר:
    • זוגות חד‑מיניים
    • אימוץ, אימוץ חם, וקיום משותף
    • מבנים משפחתיים גמישים יותר
  • המונחים ‘שותפים’, ‘הורים’, או ‘בני זוג’ מועדפים כעת כאשר מתייחסים לאינדיבידואלים ברשומת FAM.
אילוסטרציה - הסבר על מודל הנתונים של GEDCOM

למה זה חשוב?

  1. שומר על קשרים מובנים – מבטיח שכל אדם מקושר כראוי להורים, לבני זוג ולילדים.
  2. משפר תאימות – מאפשר לתוכנות גנאולוגיה לזהות ולארגן נתוני משפחה ביעילות.
  3. מגביר הכללה – תומך במבנים משפחתיים מגוונים ללא הנחת תפקידי מגדר מסורתיים.

הסבר על מבנה קובץ GEDCOM

קובץ GEDCOM מורכב משלושה חלקים עיקריים: הכותרת, הרשומות, והסיום. כל חלק ממלא תפקיד ספציפי בארגון נתוני גנאולוגיה, והמבנה של הקובץ מאורגן בקפדנות כדי להבטיח שהקשרים בין יחידים ומשפחות יהיו ברורים וסטנדרטיים.

1. חלק הכותרת

  • חלק הכותרת מסמן את תחילת קובץ GEDCOM וכולל מטא‑דאטה חשוב על הקובץ עצמו, כגון גרסתו (למשל GEDCOM 7.0) וכל הגדרה מיוחדת של הקובץ.
  • חלק זה מיוצג ברשומת HEAD.

2. חלק הרשומות

זהו החלק המרכזי של קובץ GEDCOM ומורכב ממספר סוגי רשומות, כל אחת משמשת למטרה ספציפית:

  • INDI (Individual Record): מייצגת אדם יחיד בעץ המשפחה.
  • FAM (Family Record): מייצגת משפחה, מקשרת בין בעל, אישה וילדים.
  • SOUR (Source Record): מכילה מידע על המקורות המשמשים לתמיכה בנתונים, כגון רשומות היסטוריות.
  • OBJE (Object Record): מייצגת אובייקטים מולטימדיה, כמו תמונות או מסמכים, הקשורים לאנשים או למשפחות.
  • NOTE (Note Record): מכילה הערות או תגובות נוספות שיכולות לספק הקשר או הסבר נוסף לרשומה.
  • REPO (Repository Record): מתארת מקום שבו מאוחסנים מידע גנאולוגי, כגון ספרייה או ארכיון.
  • SUBM (Submitter Record): מייצגת את האדם או הגוף שמגיש את קובץ GEDCOM.

כל אחת מהרשומות הללו בנויה בצורה היררכית, כאשר מספרי רמה שונים מציינים כיצד הנתונים קשורים. לדוגמה:

  • רמה 0 היא הרמה העליונה עבור הרשומות החשובות ביותר, כגון HEAD, TRLR, INDI, FAM, SOUR, וכד’.
  • רמה 1 ומעלה מייצגת רשומות תת‑רמה, כגון אירועים או קשרים הקשורים לאדם או למשפחה ספציפיים.

3. חלק הסיום

  • חלק הסיום מסמן את סיום קובץ GEDCOM וכולל את רשומת TRLR. הוא מציין שהקובץ הסתיים.
אילוסטרציה - מבנה קובץ GEDCOM

איך זה עובד בפועל

  • מספרי רמה: כל שורה בקובץ GEDCOM מתחילה במספר רמה (לדוגמה 0, 1, 2), כאשר 0 מייצג רשומות ברמה העליונה, ומספרים חיוביים (1, 2, וכו’) מייצגים רשומות מקוננות או תלויות. מערכת זו מבטיחה שהקשרים וההיררכיות בתוך עץ המשפחה מאורגנים כראוי.
    לדוגמה:

    • רמה 0: HEAD (רשומת כותרת), TRLR (רשומת סיום), INDI (רשומת אינדיבידואל)
    • רמה 1: MARR (אירוע נישואין), BIRT (אירוע לידה)
    • רמה 2: DATE (תאריך האירוע), PLAC (מקום האירוע)
  • כתיבת קובץ GEDCOM בכתב יד אפשרית טכנית, אך היא לא ידידותית למשתמש בשל המבנה המורכב שלה. הרבה יותר נוח להשתמש בתוכנה המיועדת לעבודה עם קבצי GEDCOM, אשר מסייעת לארגן ולעצב את הנתונים בצורה נכונה.

אימות ובקרת איכות

  • מכיוון שקבצי GEDCOM חייבים להיות מובנים היטב לשימוש והעברה נכונה, קיימים כלים לאימות שלהם נגד שגיאות.
    • PhpGedView Project: כולל מאמת GEDCOM לבדיקת המבנה.
    • The Windows GEDCOM Validator: כלי עצמאי לאימות GEDCOM.
    • Gedcheck: כלי האימות הישן, שהיה בשימוש על‑ידי הכנסייה של LDS.

אתגרים בתאימות GEDCOM

  • בתחילת שנות ה‑2000, פרויקט GEDCOM TestBook בחן את רמת התאימות של תוכנות גנאולוגיה שונות עם תקן GEDCOM 5.5. התוצאות חשפו מספר בעיות, כגון אובדן נתונים או קריאה שגויה של תגית NOTE, שיכולה להופיע ברמות שונות.

  • GEDCOM 7.0 שואף לפתור חלק מהבעיות הללו, וכלי אימות עבור התקן החדש קיימים כדי לסייע בהבטחת תאימות בין פלטפורמות שונות.

למה אימות GEDCOM חשוב?

  • מבטיח שהנתונים מאורגנים כראוי ושהקשרים בין יחידים, משפחות, אירועים ומקורות נשמרים בצורה נכונה.
  • מסייע למנוע אובדן נתונים בעת העברת קבצים בין תוכנות גנאולוגיה.
  • מקל על גנאולוגים לשתף מידע בין פלטפורמות שונות.

דוגמת קובץ GEDCOM

להלן דוגמה פשוטה של קובץ GEDCOM והסבר על מבנהו:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR

פירוק והסבר:

1. חלק הכותרת (HEAD)

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
  • 0 HEAD: מסמן את תחילת הקובץ.
  • 1 SOUR: מציין את מקור הקובץ (למשל FamilySearch GEDCOM).
  • 2 VERS 7.0: מציין את גרסת פורמט GEDCOM המשמשת (7.0 כאן).
  • 1 DEST: מציין את היעד או המערכת המיועדת לנתונים (למשל Ancestry).
  • 1 DATE: תאריך יצירת קובץ GEDCOM (לדוגמה 5 בפברואר 2025).
  • 1 SUBM: מצביע על רשומת המגיש (@SUBM1@), שתכיל מידע נוסף על המגיש.

2. רשומות אינדיבידואל (INDI)

0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
  • 0 INDI @I1@: מתחיל רשומת אינדיבידואל עם מזהה ייחודי (@I1@) עבור John Doe.
  • 1 NAME John /Doe/: שם האינדיבידואל (John Doe).
  • 1 SEX M: מגדר (M – זכר).
  • 1 BIRT: מציין אירוע לידה.
    • 2 DATE 1 JAN 1800: תאריך הלידה (1 בינואר 1800).
    • 2 PLAC New York, USA: מקום הלידה (ניו יורק, ארה״ב).

3. רשומת משפחה (FAM)

0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
  • 0 FAM @F1@: מתחיל רשומת משפחה עם מזהה ייחודי (@F1@).
  • 1 HUSB @I1@: מקשר את הבעל (John Doe, מזהה @I1@).
  • 1 WIFE @I2@: מקשר את האישה (Jane Smith, מזהה @I2@).
  • 1 CHIL @I3@: מקשר את הילד (Mary Doe, מזהה @I3@).

4. רשומת אינדיבידואל שנייה (INDI)

0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
  • 0 INDI @I2@: מתחיל רשומת Jane Smith עם מזהה ייחודי (@I2@).
  • 1 NAME Jane /Smith/: שם האינדיבידואל (Jane Smith).
  • 1 SEX F: מגדר (F – נקבה).
  • 1 BIRT: אירוע לידה.
    • 2 DATE 15 FEB 1805: תאריך הלידה (15 בפברואר 1805).
    • 2 PLAC Boston, USA: מקום הלידה (בוסטון, ארה״ב).

5. רשומת אינדיבידואל שלישית (INDI)

0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
  • 0 INDI @I3@: מתחיל רשומת Mary Doe עם מזהה ייחודי (@I3@).
  • 1 NAME Mary /Doe/: שם האינדיבידואל (Mary Doe).
  • 1 SEX F: מגדר (F – נקבה).
  • 1 BIRT: אירוע לידה.
    • 2 DATE 10 OCT 1825: תאריך הלידה (10 באוקטובר 1825).
    • 2 PLAC New York, USA: מקום הלידה (ניו יורק, ארה״ב).

6. חלק הסיום (TRLR)

0 TRLR
  • 0 TRLR: מסמן את סוף קובץ GEDCOM.

הסבר על הרשומות המרכזיות

  • רשומות INDI (אינדיבידואל): מכילות פרטים אישיים על אינדיבידואל ספציפי, כגון שם, מגדר ותאריך לידה.
  • רשומת FAM (משפחה): מחברת אינדיבידואלים ליחידות משפחתיות. היא מקשרת הורים (HUSB ו‑WIFE) וילדים (CHIL) באמצעות המזהים הייחודיים שלהם.
  • הערה על מזהים: לכל רשומה (אינדיבידואל או משפחה) מוקצה מזהה ייחודי (למשל @I1@). מזהים אלה משמשים לקישור רשומות קשורות, כגון קישור ילד להוריו.

מושגים מרכזיים

  • מספרי רמה: קבצי GEDCOM משתמשים במספרי רמה כדי לארגן נתונים במבנה היררכי. רמה 0 משמשת לרשומות עליונות (כמו INDI, FAM), ורמות 1 ו‑2 משמשות לפרטים משניים (כמו אירועים ומקומות).
  • שמות במקפים: שמות ב‑GEDCOM לעיתים מוקפים במקפים, לדוגמה John /Doe/, כדי להבדיל בין שם פרטי לשם משפחה.
אילוסטרציה - GEDCOM - הסבר על הרשומות המרכזיות

זוהי דוגמת קובץ GEDCOM בסיסית, אך קבצים מורכבים יותר יכולים לכלול אירועים מפורטים (כמו נישואין, פטירות), מקורות (למשל רשומות מפקד), והפניות למולטימדיה.

מסקנה

GEDCOM היה אבן פינה בתחום הגנאולוגיה, מאפשר החלפת נתוני גנאולוגיה בין פלטפורמות תוכנה שונות. הפורמט הסטנדרטי שלו אפשר לחוקרים, היסטוריונים וחובבנים לשתף ולשמר מידע על היסטוריית המשפחה ביעילות. עם זאת, למרות האימוץ הרחב, GEDCOM אינו חסר מגבלות. בעיות כגון תאימות בין תוכנות, חוסר יכולת לייצג קשרים מורכבים, והיעדר תמיכה בסוגי נתונים מודרניים מדגישים את הצורך בשיפורים מתמשכים או בפתרונות חלופיים.

ככל שהגנאולוגיה ממשיכה להתפתח עם התקדמות הטכנולוגיה, העתיד של GEDCOM עשוי לכלול עדכונים לתקן או פיתוח פורמטים חדשים שיתאימו טוב יותר למורכבות של מחקר גנאולוגי מודרני. לעת עתה, GEDCOM נשאר כלי חיוני לכל מי שעובד עם עצי משפחה, והבנת המבנה והפונקציונליות שלו קריטית לניהול ושיתוף נתונים יעיל בקהילת הגנאולוגיה.