La norme Gedcom en généalogie

Genepoulin.net
HomeRetour aux Chroniques Familiales.

GEDCOM (pour abréviation de GEnealogical Data COMmunication) est une norme élaborée par l'Église de Jésus-Christ des saints des derniers jours (les mormons), qui permet les échanges de données informatisées entre les différents logiciels de généalogie, quels que soient les systèmes d'exploitation ou le matériel.

Les fichiers GEDCOM sont des fichiers séquentiels en format texte. Bien que la plupart des logiciels de généalogie intègrent les fonctions les plus courantes permettant d'exporter ou d'importer des fichiers enregistrés sous ce format, de version en version, de nouveaux identificateurs ont été ajoutés au format Gedcom afin de gérer des informations supplémentaires et certains identificateurs ont été supprimés. Ainsi on ne peut pas affirmer avec certitude que tous les programmes de généalogie sont compatibles avec la plus récente version de la norme GEDCOM. Lors de l’import d’un fichier GEDCOM, un programme ignorera généralement les informations associées aux identificateurs qu’il ne reconnait pas.

[summary]

1 - Comment ça marche et à quoi ça sert ?

Un fichier GEDCOM est rédigé en texte seul. Il contient des enregistrements concernant :

La spécification GEDCOM, également appelée la norme GEDCOM, a été développée par l'Église de Jésus-Christ des saints des derniers jours (les mormons), initialement dans un but strictement religieux lié aux croyances de cette Église. Puis est venue la collaboration avec les différents éditeurs de logiciels, américains ou autres, qui a conduit à l'ajout de paramètres non réservés aux fins religieuses de l'Église.

Si l'on présume que la majorité des logiciels de généalogie sont compatibles avec la norme GEDCOM, tous, même celui des Mormons, ne la respectent dans toute son étendue [le seul logiciel connu pour être 100% Gedcom est LifeLine]. Toutefois, les fonctionnalités les plus importantes sont généralement respectées, permettant ainsi l'importation ou l'exportation des données « principales ». Il existe de nombreux outils de visualisation et de conversion d'un fichier GEDCOM, ainsi que d'outils permettant la transformation d'un fichier GEDCOM en une généalogie complète «clefs en mains» pour le Web.

Même s'il est théoriquement possible d'écrire au clavier un fichier GEDCOM, le format a été imaginé en premier lieu pour servir aux échanges informatiques entre logiciels, et la lecture et l'écriture d'un fichier GEDCOM ne sont pas particulièrement aisées pour les néophytes (et même pour les plus aguerris d'ailleurs).

Les imports et exports au format GEDCOM permettent de pratiquer des échanges entre généalogistes sur des branches dites de Cousinage. Cela permet aussi de changer de logiciel (attention : les fabricants possèdent des petits plus qui n'existent pas chez d'autres ou qui ne sont pas reconnus de la même façon). Le format GEDCOM permet aussi dans l'expression des résultats de se servir d'autres logiciels : publication sur Geneanet ou Ancestrys, listes éclairs, pages HTML prêtes à être déposée sur un site, etc.

2 - Structure d'un fichier Gedcom

Un fichier GEDCOM est divisé en :

Chacune de ces sections débute par 0, marque du niveau supérieur de l'arborescence, et est subdivisable de façon quasi-infinie, en fonction des besoins, à l'aide de marqueurs de niveaux inférieurs, permettant par exemple la saisie des « événements » (EVEN, BIRT, DEAT, MARR et un certain nombre d'autres), des « attributs » (nombre de mariages ou d'enfants, nationalité, décorations, etc.).

Chaque enregistrement, mais aussi chaque subdivision, peut généralement être relié, en fonction des besoins, à un enregistrement d'un autre type. Par exemple, la rubrique BIRT (naissance) de l'individu X sera reliée par des pointeurs : à un enregistrement NOTE ou à un enregistrement SOUR. Le même individu X pourra être relié par des pointeurs : à la famille (couple) dont il est issu, à la famille dont il est co-fondateur, à des notes ou à des sources liées à sa personne...

3 - Exemple succinct

Pour plus de lisibilité sur cet exemple, les informations sont présentées de façon indentée (en "escalier") : habituellement tout le texte est aligné à gauche sans tabulation ou annotations. Autres exemples : Fichier Gedcom minimal - Fichier Gedcom UTF8 - Fichier Gedcom mariage même sexe

Le fichier commence par une section d'en-tête débutant par 0 HEAD et se terminant à la ligne précédant 0 @I1@ INDI. Cette section comporte bien souvent 20 à 30 lignes d'informations générales sur la constitution du fichier (précisions sur le programme qui a généré le fichier, la version du gedcom, le codage des caractères, l'identité du "propriétaire" des données, etc.).

Les individus sont identifiés par un enregistrement INDI de niveau d'arborescence 0. Cet enregistrement attribue à chaque individu un numéro d'ordre, généralement précédé de la lettre I, placé entre deux signes @ (exemple: 0 @I3@ INDI ; cette ligne de niveau 0 marque le début de la section descriptive de l'individu numéro 3). Le numéro d'individu est un identifiant unique créé pour chaque nouvel individu. Notez que cette numérotation ne correspond pas à un système de numérotation généalogique tel que ceux de Sosa-Stradonitz ou d'Aboville.

Les événements 1 BIRT, 1 CHR, 1 DEAT, 1 BURI que sont la naissance, le baptême, le décès et l'inhumation respectivement peuvent être suivis d'enregistrements 2 PLAC (lieu) ou 2 DATE.

Une personne peut appartenir à une ou plusieurs familles. Une famille se compose d'un couple et de ses enfants. Comme pour les individus, les familles reçoivent un numéro d'identification, accolé à la lettre F et placé entre deux signes @ (exemple d'enregistrement: 0 @F1@ FAM ; cette ligne de niveau 0 marque le début de la section descriptive de la famille numéro 1).

Dans l'exemple ci-dessus, nous avons une famille composée des trois individus suivants:

L'enregistrement FAM avec le n° de famille donne le détail des membres (généralement le numéro de FAMille est précédé d'un F):

L'enregistrement contient aussi, le cas échéant, les indications sur le lieu (PLAC) et la date (DATE) de mariage des parents.

Ce lien familial est ensuite référencé dans les enregistrements de chaque membre en fonction de sa position dans la famille :

Une personne peut bien sûr être à la fois enfant d'une famille et parent de la famille qu'elle a elle-même fondée.

3.1 - Liste complète des indicateurs

La liste des identificateurs GEDCOM 5.5 et leur définition

Le nom complet en anglais de l’identificateur est indiqué entre crochets pour une meilleure compréhension, mais c’est toujours le nom abrégé en 3 ou 4 caractères qui est utilisé dans les fichiers GEDCOM.

ABBR abbreviation : titre abrégé, description abrégée ou nom abrégé.
ADDR address : adresse postale d’un individu, de l’auteur d’un fichier, d’une entreprise, d’une école, etc
ADR1 address1 : première ligne d’une adresse
ADR2 address2 : deuxième ligne d’une adresse
ADOP adoption : création du lien enfant-parent quand il n’existe pas de lien biologique.
AFN AFN : numéro unique et permanent du fichier Ancestral File qui contient les informations relatives à l’individu
AGE age : âge de l’individu au moment de l’événement ou âge qui figure dans le document.
AGNC agency : institution ou individu responsable ou décisionnaire
ALIA alias : indicateur qui associe des informations différentes sur une personne.
ANCE ancestors : ancêtres d’un individu
ANCI ances_interest : indique un intérêt à rechercher des informations complémentaires sur les ancêtres d’un individu (voir ESI)
ANUL annulment : déclaration de nullité d’un mariage (comme s’il n’avait pas eu lieu)
ASSO associates : indicateur qui relie des amis, des voisins, des parents ou d’autres personnes à un individu
AUTH author : nom de la personne qui a relevé les informations ou qui a constitué le fichier
BAPL baptism-LDS : baptême de l’Eglise des Mormons (à partir de l’âge de huit ans)
BAPM baptism: baptême (non Mormon, voir aussi BAPL et CHR)
BARM bar_mitzvah : cérémonie juive qui a lieu pour les garçons à l’âge de 13 ans
BASM bas_mitzvah: cérémonie juive qui a lieu pour les filles à l’âge de 13 ans, aussi appelée “Bat Mitzvah.”
BIRT birth : naissance
BLES blessing : bénédiction religieuse
BLOB binary_object : ensemble de données utilisé par un système multimédia qui gére des données binaires qui représentent les images, du son et de la vidéo.
BURI burial : sépulture
CALN call_number : numéro dans un répertoire qui sert à identifier une pièce dans une collection.
CAST caste : rang ou statut d’un individu dans une société, selon des critères raciaux ou religieux, des critères de richesse ou autres
CAUS cause : description de la cause de l’événement ou du fait associé, cause du décès par exemple.
CENS census : recensement de population
CHAN change : correction ou modification; en relation avec une DATE qui indique quand le changement est survenu.
CHAR character : indique le jeu de caractères utilisé pour l’enregistrement des informations dans le fichier.
CHIL child : enfant naturel ou adopté
CHR christening : baptême religieux (non Mormon) d’un enfant.
CHRA adult_christening : baptême religieux (non Mormon) d’une personne adulte.
CITY city : ville ou village
CONC concatenation : indicateur de continuation des informations qui précédent.– Ces informations doivent être mises à la suite de celles qui précédent sans espace ni retour au début de ligne. La coupure avec les informations précédentes doit être faite au milieu d’un champ et non pas sur un espace (l’espace est un délimiteur GEDCOM).
CONF confirmation : confirmation – cérémonie religieuse (non Mormon) par laquelle un individu acquiert la qualité de membre à part entière de son Eglise.
CONL confirmation_l : confirmation (cérémonie religieuse par laquelle un individu devient membre de l’Eglise des Mormons)
CONT continued : indicateur de continuation des informations qui précédent, après un retour à la ligne.
COPR copyright : protection des informations contre la reproduction et la diffusion.
CORP corporate : nom d’une entreprise, d’une institution ou autre.
CREM cremation : incinération du corps d’un individu décédé.
CTRY country : nom ou code du pays
DATA data : informations stockées automatiquement.
DATE date : date d’un événement au format prévu pour les dates
DEAT death : décès
DESC descendants : descendance d’un individu
DESI descendant_int : indique un intérêt à rechercher des descendants de l’individu (voir aussi ANCI)
DEST destination : système ou programme destinataire des données.
DIV divorce : dissolution du mariage
DIVF divorce_filed : dossier de divorce d’un époux
DSCR phy_description : caractères physiques de description d’une personne, d’un lieu ou d’une chose
EDUC education : niveau d’instruction
EMIG emigration : départ de son pays avec l’intention de résider ailleurs.
ENDL endowment : dotation (sacrement de l’Eglise des Mormons reçu par un individu dans un temple).
ENGA engagement : fiancailles
EVEN event : événement intéressant à propos d’un individu, d’un groupe ou d’une organisation
FAM family : association d’un homme, d’une femme et de leurs enfants selon la loi ou les coutumes, ou famille créée par la naissance d’un enfant d’un père et d’une mère biologiques.
FAMC family_child : indique la famille à laquelle un enfant appartient
FAMF family_file : nom d’un fichier de familles de l’Eglise des Mormons
FAMS family_spouse : indique la famille dans laquelle l’individu est l’un des conjoints
FCOM first_communion : cérémonie religieuse de première communion
FILE file : entité de conservation d’informations classées pouvant être référencées.
FORM format : nom donné à un format dans lequel des informations peuvent être transcrites
GEDC gedcom : information sur l’utilisation de la norme GEDCOM dans un fichier.
GIVN given_name : prénom
GRAD graduation : diplôme ou certificat
HEAD header : identification des informations du fichier GEDCOM
HUSB husband : individu marié ou père d’un enfant
IDNO ident_number : numéro d’identification d’une personne dans un fichier, une source ou un système externe
IMMI immigration : arrivée dans un nouveau lieu avec intention d’y résider
INDI individual : une personne
LANG language : langage utilisé dans le fichier
LEGA legatee : légataire
MARB marriage_bann : publication des bans de mariage
MARC marr_contract : contrat de mariage
MARL marr_license : autorisation légale de mariage
MARR marriage : création d’une famille
MARS marr_settlement : convention, contrat avant mariage
MEDI media : information sur le support des données stockées
NAME name : mot ou ensemble de mots utilisés pour l’identification d’un individu, d’un titre, etc. Il faut utiliser plusieurs lignes NAME pour les personnes qui ont des noms multiples.
NATI nationality : nationalité d’une personne
NATU naturalization : obtention de la nationalité
NCHI children_count : nombre d’enfants du parent (tous mariages confondus) s’il s’agit d’un individu ou de la famille s’il s’agit d’une famille.
NICK nickname : surnom
NMR marriage_count : nombre de mariages de la personne
NOTE note : informations complémentaires ajoutées pour la compréhension des données
NPFX name_prefix : texte ou titre qui apparait avant le nom d’une personne (Docteur, Général, Monseigneur…)
NSFX name_suffix : texte qui apparait après le nom (Junior ou fils, par exemple)
OBJE object : référence aux données utilisées comme description (généralement un enregistrement audio, une photo ou une vidéo)
OCCU occupation : profession
ORDI ordinance : sacrement religieux en général
ORDN ordination : ordination religieuse
PAGE page : numéro ou description de l’endroit où l’information se trouve dans un ouvrage référencé
PEDI pedigree : Information relative à l’individu dans un tableau d’ascendance.
PHON phone : numéro de téléphone
PLAC place : lieu de l’événement
POST postal_code : code postal
PROB probate : validation d’un testament
PROP property : biens et possessions
PUBL publication : date et lieu de publication d’un ouvrage
QUAY quality_of-data : degré de confiance à accorder à une information
REFN reference : description ou numéro d’identification d’un fichier ou de tout autre objet pouvant être référencé
RELA relationship : valeur du lien dans le contexte
RELI religion : religion
REPO repository : établissement ou personne dépositaire de l’information
RESI residence : domicile
RESN restriction : indicateur d’accès restreint ou interdit à une information
RETI retirement : retraite
RFN rec_file_number : numéro permanent affecté à un enregistrement pour l’identifier de manière unique dans un fichier
RIN rec_id_number : numéro affecté à un enregistrement automatiquement par un système émetteur qui est utilisé pour identifier cet enregistrement dans les résultats produits par un système récepteur
ROLE role : rôle tenu par un individu dans un événement
SEX sex : sexe
SLGC sealing_child : scellement d’un enfant à ses parents (cérémonie de l’Eglise des Mormons)
SLGS sealing_spouse : scellement d’un mari et d’une femme (cérémonie de l’Eglise des Mormons)
SOUR source : document d’origine ou source initiale de l’information
SPFX surn_prefix : partie d’un nom de famille qui n’est pas indexée
SSN soc_sec_number : numéro de sécurité sociale
STAE state : état (division géographique ou juridictionnelle)
STAT status : état (condition)
SUBM submitter : individu ou organisation qui fournit les données généalogiques
SUBN submission : ensemble de données à traiter
SURN surname : nom de famille
TEMP temple : nom ou code d’identification d’un temple de l’Eglise des Mormons
TEXT text : texte exact provenant d’un document original
TIME time : heures (entre 0 et 24), minutes et secondes séparées par les deux points (:). Secondes et centièmes de secondes sont optionnels.
TITL title : description d’un ouvrage, comme le titre d’un livre; titre de noblesse ou titre honorifique pour un individu
TRLR trailer : marque de fin d’un fichier GEDCOM
TYPE type : définition complémentaire de l’identificateur précédent.
VERS version : indique la version d’un produit, d’un composant ou d’un ouvrage utilisé ou référencé
WIFE wife : épouse
WILL will : testament (voir aussi PROB)

4 - La mise en œuvre de la norme GEDCOM

La mise en œuvre de la norme peut faire apparaître plusieurs problèmes.

Lors de l'importation des données, les programmes de généalogie ne détectent pas, en général, les informations erronées ou inconnues qu'ils ne prennent pas en compte.

4.1 - L'encodage des caractères du fichier

Le fichier peut être encodé de plusieurs façons : ANSEL, ANSI (Windows 1252), Macintosh, UTF-8, MS/DOS... Les programmes prennent une certaine liberté pour étendre les jeux autorisés par la norme. Celle-ci n'a pas évolué depuis 1996 et recommande l'utilisation d'ANSEL (une norme bibliographique nord-américaine obsolète) pour l'échange de fichier Gedcom accentués. La majorité des logiciels actuels recommande l'utilisation d'Unicode UTF-8 introduit par la norme GEDCOM 5.5.1 pour pouvoir utiliser tous les caractères existants

Dans la future version 7.0.0, l'encodage des caractères sera obligatoirement UTF-8 (avec [https://fr.wikipedia.org/wiki/Indicateur_d%27ordre_des_octets BOM] U+FEFF); les anciens encodages seront impossibles (disparition du tag CHAR dans le Header Gedcom)

5 - Quelques utilitaires GEDCOM

Tout logiciel de généalogie digne de ce nom dispose d'un import / export au format Gedcom. Néanmoins il est parfois nécessaire de faire appel a un utilitaire spécialisé dans la comparaison de fichiers gedcom. J'ai testé et recommande quelques outils spécifiques (désolé ce sont presque tous des utilitaires Windows ou Linux) :

Puisque le fichier Gedcom est un fichier texte régulier de base, un simple éditeur de texte tel que Notepad++ ou TextEdit (ou l'équivalent pour les systèmes d'exploitation Mac ou Linux) peut être utilisé pour nettoyer le code du fichier créé par un logiciel et revenir au standard.

Pour ma part, parce que j'utilise le logiciel Geneweb, je ne peux passer sous silence les très nombreuses options qu'il offre pour manipuler, importer ou exporter les fichiers Gedcom [voir ces possibilités].

6 - L'avenir du GEDCOM

Deux versions sont actuellement applicables :

Depuis 1996, plusieurs initiatives pour ne pas dire alternatives au fichier Gedcom, ont vu le jour sans se concrétiser :

6.1 - The Church Of Jesus Christ.org a deux initiatives en cours :

7 - Liens utiles

Avis : Certaines données sensibles (âges, notes individuelles) ne sont visibles qu'avec un Mot de Passe Ami . Si vous avez un intérêt pour cette base généalogique demandez votre mot de passe. Inscrire ce mot à la page de consultation ou cette page-ci si la case est présente. NOUVEAU: Vous devez maintenant vous connecter sous la forme nom_utilisateur:mot de passe - Exemple louis:mot (mot étant le mot de passe). Pour les habitués, le nom utilisateur est votre prénom en minuscule sans les caractères accentués. L'inscription du mot de passe fera disparaître cet avis et les noms masqués d'un 'x'.

[home] [portal] Mise à jour 22-03-2024