अंतिम अपडेट: 07 Feb, 2025

शीर्षक - GEDCOM फ़ाइल फ़ॉर्मेट और FamilySearch

GEDCOM क्या है?

GEDCOM (वंशावली डेटा संचार) एक ओपन फ़ाइल फ़ॉर्मेट है जिसे वंशावली डेटा (परिवार वृक्ष जानकारी) को संग्रहीत, विनिमय और साझा करने के लिए डिज़ाइन किया गया है। यह वंशावली सॉफ़्टवेयर और वेबसाइटों में व्यापक रूप से उपयोग होता है, जिससे विभिन्न प्लेटफ़ॉर्म के बीच परिवार वृक्ष डेटा को स्थानांतरित करना आसान हो जाता है।

चित्रण - GEDCOM फ़ाइल फ़ॉर्मेट और FamilySearch

GEDCOM किसने विकसित किया?

GEDCOM को द चर्च ऑफ़ जीसस क्राइस्ट ऑफ़ लैटर-डे सेंट्स (LDS Church) द्वारा बनाया गया था, जो FamilySearch—एक प्रमुख वंशावली अनुसंधान संगठन—को संचालित करता है। उनका लक्ष्य वंशावली डेटा प्रबंधन को सरल बनाना और बेहतर अनुसंधान सहयोग की अनुमति देना था।

GEDCOM कैसे काम करता है?

  • GEDCOM फ़ाइलें सादा टेक्स्ट फ़ाइलें हैं (अब संस्करण 7.0 से UTF-8 एन्कोडिंग का उपयोग करती हैं)।
  • इनमें व्यक्तियों की जानकारी होती है, जैसे:
    • नाम
    • जन्म और मृत्यु तिथियां
    • परिवार संबंध (माता-पिता, बच्चे, जीवनसाथी)
    • घटनाएँ (विवाह, प्रवास, आदि)
  • ये रिकॉर्ड मेटाडेटा का उपयोग करके लिंक किए जाते हैं, जिससे परिवार के सदस्यों के बीच उचित कनेक्शन सुनिश्चित होते हैं।

GEDCOM संस्करण और उद्योग मानक

  • नवीनतम आधिकारिक संस्करण है GEDCOM 7.0, जो 2021 में जारी किया गया था।
  • हालांकि, GEDCOM 5.5.1 (1999 से, 2019 में अंतिम रूप दिया गया) सबसे अधिक उपयोग किया जाने वाला मानक बना हुआ है।
  • क्योंकि GEDCOM 5.5.1 में सीमाएँ थीं, कुछ वंशावली सॉफ़्टवेयर डेवलपर्स ने इसे सुधारने के लिए कस्टम एक्सटेंशन जैसे GEDCOM 5.5 EL (Extended Locations) बनाए।

GEDCOM 7.0 का अपनाना

  • FamilySearch ने Q3 2022 तक GEDCOM 7.0 का समर्थन करने की योजना बनाई थी।
  • Ancestry.com ने भी इसे अपनाने में रुचि दिखाई है, लेकिन अभी तक कोई निश्चित कार्यान्वयन तिथि नहीं दी है।

GEDCOM क्यों महत्वपूर्ण है?

  1. क्रॉस-प्लेटफ़ॉर्म संगतता – उपयोगकर्ताओं को विभिन्न वंशावली वेबसाइटों और सॉफ़्टवेयर के बीच अपने परिवार वृक्ष डेटा को स्थानांतरित करने की अनुमति देती है।
  2. दीर्घकालिक डेटा संग्रहण – वंशावली डेटा को एक मानकीकृत फ़ॉर्मेट में सुलभ बनाए रखता है।
  3. वंशावली सहयोग – शोधकर्ताओं और परिवार इतिहासकारों को डेटा को कुशलतापूर्वक साझा और मिलाने में सक्षम बनाता है।

GEDCOM डेटा मॉडल की व्याख्या

GEDCOM एक वंशानुक्रम-लिंक्ड डेटा मॉडल का उपयोग करता है ताकि परिवार संबंधों को संरचित तरीके से व्यवस्थित किया जा सके। यह न्यूक्लियर फैमिली अवधारणा पर आधारित है, अर्थात यह रिश्तों को माता-पिता और बच्चों के रूप में रिकॉर्ड करता है, न कि केवल व्यक्तियों के रूप में।

GEDCOM डेटा मॉडल के प्रमुख घटक

  1. INDI (व्यक्ति) रिकॉर्ड

    • वंशावली फ़ाइल में प्रत्येक व्यक्ति को एक INDI (व्यक्ति) रिकॉर्ड के रूप में संग्रहीत किया जाता है।
    • प्रत्येक व्यक्ति को फ़ाइल में उचित लिंकिंग सुनिश्चित करने के लिए एक अद्वितीय आईडी संख्या दी जाती है।
  2. FAM (परिवार) रिकॉर्ड

    • परिवार रिकॉर्ड (FAM) व्यक्तियों के बीच लिंकिंग संरचना के रूप में कार्य करते हैं।
    • एक FAM रिकॉर्ड निर्धारित करता है:
      • HUSB (पति) – परिवार में पिता।
      • WIFE (पत्नी) – परिवार में माँ।
      • CHIL (बच्चा) – दंपति के बच्चे।
    • ये लेबल ऐतिहासिक हैं और मूल GEDCOM मॉडल पर आधारित हैं, लेकिन आज भी उपयोग में हैं।
चित्रण - GEDCOM डेटा मॉडल की व्याख्या

GEDCOM में लिंग प्रतिनिधित्व का विकास

  • प्रारंभ में, GEDCOM मॉडल को हेटेरोनॉर्मेटिव परिवार संरचना मानते हुए डिज़ाइन किया गया था, जहाँ पुरुष (HUSB) और महिला (WIFE) के पास बच्चे (CHIL) होते हैं
  • GEDCOM 7.0 विनिर्देशन स्पष्ट करता है कि ये शब्द लिंग भूमिकाओं या जैविक अभिभावकत्व का संकेत नहीं देते।
  • अद्यतन विनिर्देशन निम्नलिखित की अनुमति देता है:
    • समलैंगिक जोड़े
    • दत्तक, पालकत्व, और सहवास
    • अधिक लचीली परिवार संरचनाएँ
  • अब ‘साथी’, ‘अभिभावक’, या ‘जीवनसाथी’ शब्दों का उपयोग FAM रिकॉर्ड में व्यक्तियों को संदर्भित करने के लिए प्राथमिकता दी जाती है।
चित्रण - GEDCOM डेटा मॉडल की व्याख्या

यह क्यों महत्वपूर्ण है?

  1. संरचित संबंधों को बनाए रखता है – सुनिश्चित करता है कि प्रत्येक व्यक्ति को सही ढंग से माता-पिता, जीवनसाथी और बच्चों से जोड़ा गया है।
  2. संगतता में सुधार – वंशावली सॉफ़्टवेयर को परिवार डेटा को कुशलतापूर्वक पहचानने और व्यवस्थित करने की अनुमति देता है।
  3. समावेशिता बढ़ाता है – पारंपरिक लिंग भूमिकाओं को मानते हुए नहीं, विविध परिवार संरचनाओं का समर्थन करता है।

GEDCOM फ़ाइल की संरचना की व्याख्या

एक GEDCOM फ़ाइल तीन मुख्य भागों से बनी होती है: हेडर, रिकॉर्ड्स, और ट्रेलर। प्रत्येक भाग वंशावली डेटा को व्यवस्थित करने में विशिष्ट भूमिका निभाता है, और फ़ाइल की संरचना अत्यधिक व्यवस्थित होती है ताकि व्यक्तियों और परिवारों के बीच संबंध स्पष्ट और मानकीकृत हों।

1. हेडर सेक्शन

  • हेडर सेक्शन GEDCOM फ़ाइल की शुरुआत को चिह्नित करता है और फ़ाइल के बारे में महत्वपूर्ण मेटाडेटा शामिल करता है, जैसे इसका संस्करण (उदाहरण के लिए GEDCOM 7.0) और फ़ाइल के लिए कोई विशेष सेटिंग्स या कॉन्फ़िगरेशन।
  • यह भाग HEAD रिकॉर्ड द्वारा दर्शाया जाता है।

2. रिकॉर्ड्स सेक्शन

यह GEDCOM फ़ाइल का मुख्य भाग है और इसमें कई विभिन्न रिकॉर्ड प्रकार होते हैं, प्रत्येक एक विशिष्ट उद्देश्य की पूर्ति करता है:

  • INDI (व्यक्ति रिकॉर्ड): परिवार वृक्ष में एक व्यक्तिगत व्यक्ति को दर्शाता है।
  • FAM (परिवार रिकॉर्ड): एक परिवार को दर्शाता है, जिसमें पति, पत्नी और बच्चे जुड़े होते हैं।
  • SOUR (स्रोत रिकॉर्ड): डेटा को समर्थन देने वाले स्रोतों की जानकारी रखता है, जैसे ऐतिहासिक रिकॉर्ड।
  • OBJE (ऑब्जेक्ट रिकॉर्ड): मल्टीमीडिया वस्तुओं को दर्शाता है, जैसे फोटो या दस्तावेज़, जो व्यक्तियों या परिवारों से जुड़े होते हैं।
  • NOTE (नोट रिकॉर्ड): अतिरिक्त नोट्स या टिप्पणी शामिल करता है जो रिकॉर्ड के लिए अतिरिक्त संदर्भ या व्याख्या प्रदान कर सकते हैं।
  • REPO (रिपॉजिटरी रिकॉर्ड): वह स्थान वर्णित करता है जहाँ वंशावली जानकारी संग्रहीत होती है, जैसे पुस्तकालय या अभिलेखागार।
  • SUBM (सबमिटर रिकॉर्ड): GEDCOM फ़ाइल जमा करने वाले व्यक्ति या इकाई को दर्शाता है।

इनमें से प्रत्येक रिकॉर्ड पदानुक्रमित रूप से संरचित होता है, विभिन्न लेवल नंबर यह दर्शाते हैं कि डेटा कैसे संबंधित है। उदाहरण के लिए:

  • लेवल 0 सबसे महत्वपूर्ण रिकॉर्ड जैसे HEAD, TRLR, INDI, FAM, SOUR, आदि के लिए शीर्ष स्तर है।
  • लेवल 1 या उससे अधिक उप-स्तर रिकॉर्ड्स को दर्शाता है, जैसे किसी विशिष्ट व्यक्ति या परिवार से जुड़े घटनाएँ या संबंध।

3. ट्रेलर सेक्शन

  • ट्रेलर सेक्शन GEDCOM फ़ाइल के अंत को चिह्नित करता है और इसमें TRLR रिकॉर्ड शामिल होता है। यह दर्शाता है कि फ़ाइल समाप्त हो गई है।
चित्रण - GEDCOM फ़ाइल की संरचना की व्याख्या

व्यावहारिक रूप में यह कैसे काम करता है

  • लेवल नंबर: GEDCOM फ़ाइल की प्रत्येक पंक्ति एक लेवल नंबर (जैसे 0, 1, 2) से शुरू होती है, जहाँ 0 शीर्ष-स्तर रिकॉर्ड को दर्शाता है, और सकारात्मक पूर्णांक (1, 2, आदि) नेस्टेड या अधीनस्थ रिकॉर्ड को दर्शाते हैं। यह प्रणाली परिवार वृक्ष में संबंधों और पदानुक्रमों को सही ढंग से व्यवस्थित करती है।
  • उदाहरण के लिए:
    • लेवल 0: HEAD (हेडर रिकॉर्ड), TRLR (ट्रेलर रिकॉर्ड), INDI (व्यक्ति रिकॉर्ड)
    • लेवल 1: MARR (विवाह घटना), BIRT (जन्म घटना)
    • लेवल 2: DATE (घटना की तिथि), PLAC (घटना का स्थान)
  • GEDCOM फ़ाइल को हाथ से लिखना तकनीकी रूप से संभव है, लेकिन इसकी संरचित प्रकृति के कारण यह मानव-अनुकूल नहीं है। GEDCOM फ़ाइलों के साथ काम करने के लिए डिज़ाइन किए गए सॉफ़्टवेयर का उपयोग करना बहुत आसान है, जो डेटा को सही ढंग से व्यवस्थित और स्वरूपित करने में मदद करता है।

सत्यापन और गुणवत्ता नियंत्रण

  • चूँकि GEDCOM फ़ाइलों को सही उपयोग और स्थानांतरण के लिए अच्छी तरह से संरचित होना आवश्यक है, इसलिए उन्हें त्रुटियों के लिए सत्यापित करने के उपकरण मौजूद हैं।
    • PhpGedView Project: संरचना की जाँच के लिए GEDCOM वैलिडेटर शामिल करता है।
    • The Windows GEDCOM Validator: एक स्टैंडअलोन टूल GEDCOM वैलिडेशन के लिए।
    • Gedcheck: पुराना वैलिडेशन टूल, जिसे पहले LDS Church द्वारा उपयोग किया जाता था।

GEDCOM संगतता में चुनौतियाँ

  • शुरुआती 2000 के दशक में, GEDCOM TestBook Project ने जांचा कि विभिन्न वंशावली सॉफ़्टवेयर GEDCOM 5.5 मानक के साथ कितनी संगत हैं। परिणामों ने कई समस्याओं को उजागर किया, जैसे डेटा हानि या NOTE टैग का अनुचित पढ़ना, जो कई स्तरों पर दिखाई दे सकता है।
  • GEDCOM 7.0 इन समस्याओं में से कुछ को हल करने का लक्ष्य रखता है, और इस नए मानक के लिए वैलिडेशन टूल मौजूद हैं जो विभिन्न प्लेटफ़ॉर्म पर संगतता सुनिश्चित करने में मदद करते हैं।

GEDCOM वैलिडेशन क्यों महत्वपूर्ण है?

  • यह सुनिश्चित करता है कि डेटा सही ढंग से संरचित है और व्यक्तियों, परिवारों, घटनाओं और स्रोतों के बीच संबंध उचित रूप से बनाए रखे गए हैं।
  • वंशावली प्रोग्रामों के बीच फ़ाइलों को स्थानांतरित करते समय डेटा हानि से बचाता है।
  • विभिन्न प्लेटफ़ॉर्म पर वंशावली शोधकर्ताओं के लिए सूचना साझा करना आसान बनाता है।

GEDCOM फ़ाइल का उदाहरण

यहाँ एक सरल GEDCOM फ़ाइल का उदाहरण और उसकी संरचना की व्याख्या दी गई है:

0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR

1. हेडर सेक्शन (HEAD)

  • 0 HEAD: फ़ाइल की शुरुआत को चिह्नित करता है।
  • 1 SOUR: फ़ाइल के स्रोत को दर्शाता है (जैसे FamilySearch GEDCOM)।
  • 2 VERS 7.0: उपयोग किए गए GEDCOM फ़ॉर्मेट का संस्करण निर्दिष्ट करता है (यहाँ 7.0)।
  • 1 DEST: डेटा के इच्छित गंतव्य या सिस्टम को दर्शाता है (जैसे Ancestry)।
  • 1 DATE: GEDCOM फ़ाइल के निर्माण की तिथि (जैसे 5 फ़रवरी 2025)।
  • 1 SUBM: सबमिटर रिकॉर्ड (@SUBM1@) की ओर संकेत करता है, जिसमें फ़ाइल जमा करने वाले व्यक्ति की अधिक जानकारी होगी।

2. व्यक्ति रिकॉर्ड (INDI)

  • 0 INDI @I1@: जॉन डो के लिए एक अद्वितीय आईडी (@I1@) के साथ व्यक्ति रिकॉर्ड की शुरुआत को चिह्नित करता है।
  • 1 NAME John /Doe/: व्यक्ति का नाम (John Doe)।
  • 1 SEX M: व्यक्ति का लिंग (M = पुरुष)।
  • 1 BIRT: व्यक्ति के जन्म इवेंट को दर्शाता है।
    • 2 DATE 1 JAN 1800: जन्म तिथि (1 जनवरी 1800)।
    • 2 PLAC New York, USA: जन्म स्थान (न्यूयॉर्क, USA)।

3. परिवार रिकॉर्ड (FAM)

  • 0 FAM @F1@: एक अद्वितीय आईडी (@F1@) के साथ परिवार रिकॉर्ड की शुरुआत को चिह्नित करता है।
  • 1 HUSB @I1@: पति (John Doe, आईडी @I1@) को लिंक करता है।
  • 1 WIFE @I2@: पत्नी (Jane Smith, आईडी @I2@) को लिंक करता है।
  • 1 CHIL @I3@: बच्चे (Mary Doe, आईडी @I3@) को लिंक करता है।

4. दूसरा व्यक्ति रिकॉर्ड (INDI)

  • 0 INDI @I2@: जेन स्मिथ के व्यक्तिगत रिकॉर्ड की शुरुआत को एक अद्वितीय आईडी (@I2@) के साथ चिह्नित करता है।
  • 1 NAME Jane /Smith/: व्यक्ति का नाम (Jane Smith)।
  • 1 SEX F: व्यक्ति का लिंग (F = महिला)।
  • 1 BIRT: व्यक्ति के जन्म इवेंट को दर्शाता है।
    • 2 DATE 15 FEB 1805: जन्म तिथि (15 फ़रवरी 1805)।
    • 2 PLAC Boston, USA: जन्म स्थान (बोस्टन, USA)।

5. तीसरा व्यक्ति रिकॉर्ड (INDI)

  • 0 INDI @I3@: मैरी डो के व्यक्तिगत रिकॉर्ड की शुरुआत को एक अद्वितीय आईडी (@I3@) के साथ चिह्नित करता है।
  • 1 NAME Mary /Doe/: व्यक्ति का नाम (Mary Doe)।
  • 1 SEX F: व्यक्ति का लिंग (F = महिला)।
  • 1 BIRT: व्यक्ति के जन्म इवेंट को दर्शाता है।
    • 2 DATE 10 OCT 1825: जन्म तिथि (10 अक्टूबर 1825)।
    • 2 PLAC New York, USA: जन्म स्थान (न्यूयॉर्क, USA)।

6. ट्रेलर सेक्शन (TRLR)

  • 0 TRLR: GEDCOM फ़ाइल के अंत को चिह्नित करता है।

मुख्य रिकॉर्ड्स की व्याख्या

  • INDI (व्यक्ति) रिकॉर्ड: इनमें किसी विशिष्ट व्यक्ति के व्यक्तिगत विवरण होते हैं, जैसे नाम, लिंग, और जन्म तिथि।
  • FAM (परिवार) रिकॉर्ड: यह व्यक्तियों को जोड़कर परिवार इकाइयाँ बनाता है। यह अभिभावकों (HUSB और WIFE) और बच्चों (CHIL) को उनके अद्वितीय आईडी के माध्यम से जोड़ता है।
  • आईडी के बारे में नोट: प्रत्येक रिकॉर्ड (व्यक्ति या परिवार) को एक अद्वितीय आईडी दी जाती है (जैसे John Doe के लिए @I1@)। इन आईडी का उपयोग संबंधित रिकॉर्ड को लिंक करने के लिए किया जाता है, जैसे बच्चे को उनके अभिभावकों से जोड़ना।

मुख्य अवधारणाएँ

  • लेवल नंबर: GEDCOM फ़ाइलें डेटा को पदानुक्रमित संरचना में व्यवस्थित करने के लिए लेवल नंबर का उपयोग करती हैं। लेवल 0 शीर्ष-स्तर रिकॉर्ड (जैसे INDI, FAM) के लिए है, और लेवल 1 और 2 उप-स्तर विवरणों (जैसे घटनाएँ और स्थान) के लिए उपयोग होते हैं।
  • स्लैश में नाम: GEDCOM में नाम अक्सर स्लैश में लिखे जाते हैं, जैसे John /Doe/, जो उपनाम को दिए गए नाम से अलग करता है।
चित्रण - GEDCOM - मुख्य रिकॉर्ड्स की व्याख्या

यह एक बुनियादी GEDCOM फ़ाइल है, लेकिन अधिक जटिल फ़ाइलों में विस्तृत घटनाएँ (जैसे विवाह, मृत्यु), स्रोत (जैसे जनगणना रिकॉर्ड), और मल्टीमीडिया संदर्भ शामिल हो सकते हैं।

निष्कर्ष

GEDCOM ने वंशावली के क्षेत्र में एक मुख्य आधार के रूप में कार्य किया है, जिससे विभिन्न सॉफ़्टवेयर प्लेटफ़ॉर्म के बीच वंशावली डेटा का आदान-प्रदान संभव हुआ है। इसका मानकीकृत फ़ॉर्मेट शोधकर्ताओं, इतिहासकारों और शौक़ीनों को पारिवारिक इतिहास डेटा को कुशलतापूर्वक साझा और संरक्षित करने की सुविधा देता है। हालांकि, व्यापक अपनाने के बावजूद, GEDCOM बिना सीमाओं के नहीं है। सॉफ़्टवेयर के बीच संगतता, जटिल रिश्तों को दर्शाने की असमर्थता, और आधुनिक डेटा प्रकारों के समर्थन की कमी जैसी समस्याएँ निरंतर सुधार या वैकल्पिक समाधानों की आवश्यकता को उजागर करती हैं।

जैसे-जैसे प्रौद्योगिकी में प्रगति होती है, GEDCOM का भविष्य मानक में अपडेट या नई फ़ॉर्मेट्स के विकास को शामिल कर सकता है जो आधुनिक वंशावली अनुसंधान की जटिलताओं को बेहतर ढंग से समायोजित कर सके। अभी के लिए, GEDCOM उन सभी के लिए एक आवश्यक उपकरण बना रहता है जो परिवार वृक्षों के साथ काम करते हैं, और इसका संरचना और कार्यक्षमता को समझना वंशावली समुदाय में प्रभावी डेटा प्रबंधन और साझा करने के लिए महत्वपूर्ण है।