Last Updated: 07 Feb, 2025

Mikä on GEDCOM?
GEDCOM (Genealogical Data Communication) on avoin tiedostomuoto, joka on suunniteltu sukututkimustietojen tallentamiseen, vaihtamiseen ja jakamiseen (perhesukupuun tiedot). Sitä käytetään laajasti sukututkimusohjelmistoissa ja -sivustoilla, mikä helpottaa siirtämistä perhesukupuun tietoja eri alustojen välillä.

Kuka kehitti GEDCOMin?
GEDCOMin loi The Church of Jesus Christ of Latter-day Saints (LDS Church), joka ylläpitää FamilySearchia—merkittävää sukututkimusorganisaatiota. Heidän tavoitteensa oli yksinkertaistaa sukututkimustietojen hallintaa ja mahdollistaa parempi tutkimusyhteistyö.
Miten GEDCOM toimii?
- GEDCOM-tiedostot ovat pelkistettyjä tekstitiedostoja (käyttävät nyt UTF-8-merkistöä version 7.0 alkaen).
- Ne sisältävät tietoja henkilöistä, kuten:
- Nimet
- Syntymä- ja kuolinaikoja
- Perhesuhteita (vanhemmat, lapset, puolisot)
- Tapahtumia (avioliitto, maahanmuutto, jne.)
- Nämä tietueet on linkitetty metatietojen avulla, mikä varmistaa oikeat yhteydet perheenjäsenten välillä.
GEDCOM-versiot ja alan standardit
- Uusin virallinen versio on GEDCOM 7.0, julkaistu 2021.
- Kuitenkin GEDCOM 5.5.1 (vuodelta 1999, viimeistellyt 2019)** on edelleen laajimmin käytetty standardi.
- Koska GEDCOM 5.5.1:ssä oli rajoituksia, jotkut sukututkimusohjelmistojen kehittäjät loivat räätälöityjä laajennuksia kuten GEDCOM 5.5 EL (Extended Locations) parantaakseen sitä.
GEDCOM 7.0:n käyttöönotto
- FamilySearch suunnitteli tukevansa GEDCOM 7.0:aa 2022 Q3.
- Ancestry.com on myös osoittanut kiinnostusta sen käyttöönottoon, mutta ei ole antanut tarkkaa toteutuspäivämäärää.
Miksi GEDCOM on tärkeä?
- Alustojen välinen yhteensopivuus – Mahdollistaa käyttäjien siirtää perhesukupuun tietoja eri sukututkimussivustojen ja -ohjelmistojen välillä.
- Pitkäaikainen tietojen tallennus – Varmistaa, että sukututkimustiedot pysyvät saavutettavina standardoidussa muodossa.
- Sukututkimusyhteistyö – Mahdollistaa tutkijoiden ja perhehistorioitsijoiden jakaa ja yhdistää tietoja tehokkaasti.
GEDCOM-datamallin selitys
GEDCOM käyttää sukupolvien välistä linkitettyä datamallia järjestämään perhesuhteita rakenteellisella tavalla. Se perustuu ydinperhe-konseptiin, mikä tarkoittaa, että se kirjaa suhteet vanhempien ja lasten perusteella eikä pelkästään yksilöiden.
GEDCOM-datamallin keskeiset osat
INDI (Yksilö) -tietueet
- Jokainen henkilö sukututkimustiedostossa tallennetaan INDI (yksilö) -tietueena.
- Jokaiselle yksilölle annetaan uniikki tunnusnumero, jotta linkitys tiedostossa on oikea.
FAM (Perhe) -tietueet
- Perhetietueet (FAM) toimivat linkkirakenteena yksilöiden välillä.
- FAM-tietue määrittää:
- HUSB (mies) – Perheen isä.
- WIFE (nainen) – Perheen äiti.
- CHIL (lapsi) – Pariskunnan lapset.
- Nämä merkinnät ovat historiallisia ja perustuvat alkuperäiseen GEDCOM-malliin, mutta niitä käytetään edelleen.

Sukupuoliesityksen kehitys GEDCOMissa
- Alun perin GEDCOM-malli suunniteltiin oletuksena heteronormatiivinen perherakenne, jossa mies (HUSB) ja nainen (WIFE) saavat lapsia (CHIL).
- GEDCOM 7.0 -määritys selventää, että nämä termit eivät tarkoita sukupuolirooleja tai biologista vanhemmuutta.
- Päivitetty määrittely mahdollistaa:
- Saman sukupuolen parit
- Adoptio, hoiva ja yhteiselämä
- Joustavammat perherakenteet
- Termit ‘kumppanit’, ‘vanhemmat’ tai ‘puolisot’ ovat nyt suositeltavampia viitattaessa yksilöihin FAM-tietueessa.

Miksi tämä on tärkeää?
- Säilyttää rakenteelliset suhteet – Varmistaa, että jokainen henkilö on oikein linkitetty vanhempiin, puolisoon ja lapseen.
- Parantaa yhteensopivuutta – Mahdollistaa sukututkimusohjelmistojen tunnistaa ja järjestää perhetiedot tehokkaasti.
- Lisää inklusiivisuutta – Tukee monipuolisia perherakenteita ilman perinteisten sukupuoliroolien oletuksia.
GEDCOM-tiedoston rakenteen selitys
GEDCOM-tiedosto koostuu kolmesta pääosasta: otsikkotiedosta, tietueista ja loppuosasta. Jokainen osa täyttää erityisen roolin sukututkimustietojen järjestämisessä, ja tiedoston rakenne on tarkkaan järjestetty, jotta yksilöiden ja perheiden väliset suhteet ovat selkeitä ja standardoituja.
1. Otsikkotieto (Header) -osio
- Otsikkotieto (Header) -osio merkitsee GEDCOM-tiedoston alkua ja sisältää tärkeitä metatietoja tiedostosta, kuten sen version (esim. GEDCOM 7.0) ja mahdolliset erityisasetukset tai -konfiguraatiot.
- Tämä osio esitetään HEAD-tietueena.
2. Tietueet (Records) -osio
Tämä on GEDCOM-tiedoston pääosa ja koostuu useista eri tietuetyypeistä, joista jokainen palvelee tiettyä tarkoitusta:
- INDI (Yksilötietue): Edustaa yksittäistä henkilöä perhesukupuussa.
- FAM (Perhetietue): Edustaa perhettä, linkittäen miehen, naisen ja lapset.
- SOUR (Lähdetietue): Sisältää tietoa tiedon tukena käytetyistä lähteistä, kuten historiallisista asiakirjoista.
- OBJE (Objektitietue): Edustaa multimediallisia objekteja, kuten valokuvia tai asiakirjoja, jotka liittyvät yksilöihin tai perheisiin.
- NOTE (Muistiotietue): Sisältää lisämuistiinpanoja tai kommentteja, jotka voivat tarjota lisäyhteyksiä tai selityksiä tietueelle.
- REPO (Arkistotietue): Kuvaa paikkaa, jossa sukututkimustiedot säilytetään, kuten kirjasto tai arkisto.
- SUBM (Lähettäjätietue): Edustaa henkilöä tai tahoa, joka lähettää GEDCOM-tiedoston.
Jokainen näistä tietueista on hierarkkisesti rakenteellinen, ja eri tasojen numerot osoittavat, miten tiedot liittyvät toisiinsa. Esimerkiksi:
- Taso 0 on ylimmän tason tietueille, kuten HEAD, TRLR, INDI, FAM, SOUR, jne.
- Taso 1 tai korkeampi edustaa alitason tietueita, kuten tapahtumia tai suhteita, jotka on sidottu tiettyyn yksilöön tai perheeseen.
3. Loppuosa (Trailer) -osio
Loppuosa (Trailer) -osio merkitsee GEDCOM-tiedoston loppua ja sisältää TRLR-tietueen. Se osoittaa, että tiedosto on päättynyt.

Käytännön toiminta
Tasonumerot: Jokainen rivi GEDCOM-tiedostossa alkaa tasonumerolla (esim. 0, 1, 2), jossa 0 edustaa ylimmän tason tietueita, ja positiiviset kokonaisluvut (1, 2, jne.) edustavat sisäkkäisiä tai alitason tietueita. Tämä järjestelmä varmistaa, että perhesukupuun suhteet ja hierarkiat ovat oikein järjestettyjä.
Esimerkkejä:
- Taso 0: HEAD (Otsikkotieto), TRLR (Loppuosa), INDI (Yksilötietue)
- Taso 1: MARR (Avioliitto), BIRT (Syntymä)
- Taso 2: DATE (Tapahtuman päivämäärä), PLAC (Tapahtuman paikka)
GEDCOM-tiedoston kirjoittaminen käsin on teknisesti mahdollista, mutta se on ei-ihmisystävällistä sen rakenteellisen luonteen vuoksi. On paljon helpompaa käyttää GEDCOM-tiedostoja käsitteleviä ohjelmistoja, jotka auttavat järjestämään ja muotoilemaan tiedot oikein.
Validointi ja laadunvalvonta
Koska GEDCOM-tiedostojen on oltava hyvin rakenteellisia asianmukaista käyttöä ja siirtoa varten, on olemassa työkaluja niiden validointiin virheiden varalta.
- PhpGedView Project: Sisältää GEDCOM-validoinnin rakenteen tarkistamiseen.
- The Windows GEDCOM Validator: Itsenäinen työkalu GEDCOM-validointiin.
- Gedcheck: Vanhempi validointityökalu, jota LDS Church käytti aiemmin.
GEDCOM-yhteensopivuus haasteet
2000-luvun alussa GEDCOM TestBook Project arvioi, kuinka hyvin eri sukututkimusohjelmistot noudattivat GEDCOM 5.5 -standardia. Tulokset paljastivat useita ongelmia, kuten tietojen menetyksiä tai NOTE-tunnisteen virheellistä lukemista, joka voi esiintyä useilla tasoilla.
GEDCOM 7.0 pyrkii ratkaisemaan joitakin näistä ongelmista, ja validointityökalut tälle uudelle standardille ovat olemassa auttamaan yhteensopivuuden varmistamisessa eri alustoilla.
Miksi GEDCOM-validointi on tärkeää?
- Varmistaa, että tiedot on rakenteellisesti oikein ja että yksilöiden, perheiden, tapahtumien ja lähteiden väliset suhteet säilyvät oikein.
- Auttaa välttämään tietojen menetyksiä siirrettäessä tiedostoja sukututkimusohjelmien välillä.
- Helpottaa sukututkijoiden tiedon jakamista eri alustoilla.
Esimerkki GEDCOM-tiedostosta
Tässä on yksinkertainen esimerkki GEDCOM-tiedostosta ja sen rakenteen selitys:
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
0 TRLR
Erottelu ja selitys:
1. Otsikkotieto (HEAD)
0 HEAD
1 SOUR FamilySearch GEDCOM
2 VERS 7.0
2 NAME FamilySearch
1 DEST Ancestry
1 DATE 5 FEB 2025
1 SUBM @SUBM1@
- 0 HEAD: Merkitsee tiedoston alkua.
- 1 SOUR: Ilmoittaa tiedoston lähteen (esim. FamilySearch GEDCOM).
- 2 VERS 7.0: Määrittää käytetyn GEDCOM-muodon version (tässä 7.0).
- 1 DEST: Ilmoittaa tiedoston kohdejärjestelmän (esim. Ancestry).
- 1 DATE: GEDCOM-tiedoston luontipäivämäärä (esim. 5. helmikuuta 2025).
- 1 SUBM: Viittaa lähettäjätietueeseen (@SUBM1@), jossa on lisätietoja tiedoston lähettäjästä.
2. Yksilötietueet (INDI)
0 INDI @I1@
1 NAME John /Doe/
1 SEX M
1 BIRT
2 DATE 1 JAN 1800
2 PLAC New York, USA
- 0 INDI @I1@: Merkitsee yksilötietueen alkua, jossa on uniikki tunnus (@I1@) John Doe:lle.
- 1 NAME John /Doe/: Henkilön nimi (John Doe).
- 1 SEX M: Henkilön sukupuoli (M = mies).
- 1 BIRT: Ilmoittaa syntymätapahtuman.
- 2 DATE 1 JAN 1800: Syntymäpäivä (1. tammikuuta 1800).
- 2 PLAC New York, USA: Syntymäpaikka (New York, USA).
3. Perhetietue (FAM)
0 FAM @F1@
1 HUSB @I1@
1 WIFE @I2@
1 CHIL @I3@
- 0 FAM @F1@: Merkitsee perhetietueen alkua, jossa on uniikki tunnus (@F1@).
- 1 HUSB @I1@: Linkittää miehen (John Doe, ID @I1@).
- 1 WIFE @I2@: Linkittää naisen (Jane Smith, ID @I2@).
- 1 CHIL @I3@: Linkittää lapsen (Mary Doe, ID @I3@).
4. Toinen yksilötietue (INDI)
0 INDI @I2@
1 NAME Jane /Smith/
1 SEX F
1 BIRT
2 DATE 15 FEB 1805
2 PLAC Boston, USA
- 0 INDI @I2@: Merkitsee Jane Smithin yksilötietueen alkua, jossa on uniikki tunnus (@I2@).
- 1 NAME Jane /Smith/: Henkilön nimi (Jane Smith).
- 1 SEX F: Sukupuoli (F = nainen).
- 1 BIRT: Syntymätapahtuma.
- 2 DATE 15 FEB 1805: Syntymäpäivä (15. helmikuuta 1805).
- 2 PLAC Boston, USA: Syntymäpaikka (Boston, USA).
5. Kolmas yksilötietue (INDI)
0 INDI @I3@
1 NAME Mary /Doe/
1 SEX F
1 BIRT
2 DATE 10 OCT 1825
2 PLAC New York, USA
- 0 INDI @I3@: Merkitsee Mary Doen yksilötietueen alkua, jossa on uniikki tunnus (@I3@).
- 1 NAME Mary /Doe/: Henkilön nimi (Mary Doe).
- 1 SEX F: Sukupuoli (F = nainen).
- 1 BIRT: Syntymätapahtuma.
- 2 DATE 10 OCT 1825: Syntymäpäivä (10. lokakuuta 1825).
- 2 PLAC New York, USA: Syntymäpaikka (New York, USA).
6. Loppuosa (TRLR)
0 TRLR
- 0 TRLR: Merkitsee GEDCOM-tiedoston loppua.
Keskeisten tietueiden selitys
- INDI (Yksilötietueet): Nämä sisältävät henkilökohtaisia tietoja, kuten nimi, sukupuoli ja syntymäaika.
- FAM (Perhetietue): Tämä linkittää yksilöt perheyksiköiksi. Se yhdistää vanhemmat (HUSB ja WIFE) ja lapset (CHIL) niiden uniikkeilla tunnuksilla.
- Huomautus ID-tunnuksista: Jokaiselle tietueelle (yksilö tai perhe) annetaan uniikki tunnus (esim.
@I1@). Näitä tunnuksia käytetään linkittämään toisiinsa liittyvät tietueet, kuten lapsen linkittäminen vanhempiinsa.
Keskeiset käsitteet
- Tasonumerot: GEDCOM-tiedostot käyttävät tasonumeroita järjestämään tiedot hierarkkisesti. Taso 0 on ylimmän tason tietueille (kuten INDI, FAM), ja Taso 1 ja 2 käytetään alitason tietoihin (kuten tapahtumat ja paikat).
- Nimet kauttaviivoilla: GEDCOMissa nimet on usein kirjoitettu kauttaviivojen (/) väliin, kuten John /Doe/, mikä erottaa sukunimen etunimestä.

Tämä on perus GEDCOM-tiedosto, mutta monimutkaisemmat tiedostot voivat sisältää tarkempia tapahtumia (kuten avioliittoja, kuolemia), lähteitä (esim. väestönlaskentatietoja) ja multimediallisia viitteitä.
Yhteenveto
GEDCOM on ollut kulmakivi sukututkimuksen alalla, mahdollistaen sukututkimustietojen vaihtamisen eri ohjelmistualustojen välillä. Sen standardoitu muoto on sallinut tutkijoiden, historioitsijoiden ja harrastajien jakaa ja säilyttää perhehistoriaa tehokkaasti. Kuitenkin, laajamittaisen omaksumisen lisäksi, GEDCOMilla on rajoitteita. Yhteensopivuusongelmat eri ohjelmistojen välillä, monimutkaisten suhteiden esittämisen vaikeus ja modernien tietotyyppien puute korostavat tarvetta jatkuville parannuksille tai vaihtoehtoisille ratkaisuja.
Kun sukututkimus kehittyy teknologian edistymisen myötä, GEDCOMin tulevaisuus voi sisältää päivityksiä standardiin tai uusien formaattien kehittämistä, jotka paremmin vastaavat nykyaikaisen sukututkimuksen monimutkaisuutta. Toistaiseksi GEDCOM pysyy olennaisena työkaluna kaikille, jotka työskentelevät perhesukupuiden parissa, ja sen rakenteen ja toiminnallisuuden ymmärtäminen on keskeistä tehokkaalle tietojen hallinnalle ja jakamiselle sukututkimusyhteisössä.