Saltar para o conteúdo

FamilySearch GEDCOM

Origem: Wikipédia, a enciclopédia livre.
(Redirecionado de Gedcom)
GEDCOM
Extensão do arquivo .ged, .gdz
MIME application/vnd.familysearch.gedcom [1] application/vnd.familysearch.gedcom+zip [1]
Desenvolvido por FamilySearch
Lançamento 1984; há 40 anos
Última versão 7.0.13 (4 agosto 2023; há 10 meses)
Página oficial gedcom.io
github.com/familysearch/GEDCOM

FamilySearch GEDCOM, ou simplesmente GEDCOM (/ˈɛdkɒm/ JED-kom),[2] é, de facto, uma especificação de formado eletrônico aberto para armazenar dados genealógicos, e importá-los ou exportá-los entre softwares de genealogia compatíveis. GEDCOM significa em inglês: Genealogical Data Communication (Comunicação de Dados Genealógicos). GEDCOM foi desenvolvido por A Igreja de Jesus Cristo dos Santos dos Últimos Dias, como uma ajuda para a pesquisa genealógica.[3] A maioria dos softwares de genealogia suporta a importação e exportação neste formato, além de existir vários conversores de GEDCOM para HTML.[4]

A partir da versão 7.0, um arquivo GEDCOM é definido como texto simples codificado em UTF-8. Este arquivo contém informações genealógicas sobre indivíduos, como nomes, eventos e relacionamentos; metadados vinculam esses registros entre si. O GEDCOM 7.0 é a primeira versão a utilizar versionamento semântico e é a versão mais recente da especificação até o momento.

O antecessor do GEDCOM 7.0, o GEDCOM 5.5.1, foi lançado como um rascunho em 1999. Ele recebeu apenas atualizações menores nos últimos 20 anos. A falta de atualizações no padrão e deficiências em suas capacidades levaram alguns programas de genealogia a adicionar extensões proprietárias ao formato, como a especificação GEDCOM 5.5 EL (Extended Locations), que nem sempre é reconhecida por outros programas de genealogia.[5][6][7] Outros padrões, como o GEDCOM X, foram sugeridos como substitutos completos para o GEDCOM.[8]

Modelo[editar | editar código-fonte]

O GEDCOM utiliza um modelo de dados vinculado por linhagem, com ênfase na família nuclear e nos indivíduos (filhos) produzidos por essa família.[9] Esses objetivos históricos são descritos no documento de especificação 7.0, onde "O registro FAM foi originalmente estruturado para representar famílias onde um HUSB (marido ou pai) e uma WIFE (esposa ou mãe) produzem CHIL (filhos)."[10]

O documento continua dizendo que esses tipos de registro podem ser usados de forma mais flexível para refletir diferentes conceitos de família. "O registro FAM também pode ser usado para paralelos culturais a isso, incluindo famílias nucleares, casamento, coabitação, adoção, e assim por diante, independentemente do gênero dos parceiros... Os indivíduos apontados por HUSB e WIFE são coletivamente referidos como 'parceiros', 'pais' ou 'cônjuges'."[10]

Estrutura[editar | editar código-fonte]

Um arquivo GEDCOM consiste em uma seção de cabeçalho, registros e uma seção de trailer. Dentro dessas seções, os registros representam pessoas (registro INDI), famílias (registros FAM), fontes de informação (registros SOUR) e outros registros diversos, incluindo notas. Cada linha de um arquivo GEDCOM começa com um número de nível, onde todos os registros de nível superior (HEAD, TRLR, SUBN, e cada INDI, FAM, OBJE, NOTE, REPO, SOUR e SUBM) começam com uma linha de nível 0, enquanto outros números de nível são inteiros positivos.

Embora seja possível escrever um arquivo GEDCOM à mão, o formato foi projetado para ser utilizado com software e, portanto, não é especialmente amigável para humanos. Um validador GEDCOM[11] que pode ser usado para validar a estrutura de um arquivo GEDCOM está incluído como parte do projeto PhpGedView, embora não seja destinado a ser um validador independente.[12] Para validação independente, pode-se usar o "Windows GEDCOM Validator"[13] ou o Gedcheck mais antigo e não mantido pela Igreja.

Durante o ano de 2001, o Projeto TestBook GEDCOM avaliou quão bem quatro programas populares de genealogia se conformavam ao padrão GEDCOM 5.5 usando o programa Gedcheck.[14] Os resultados mostraram que vários problemas existiam e que "A falha mais comum que levava à perda de dados era a incapacidade de ler a tag NOTE em todos os níveis possíveis em que ela pode aparecer."[15] Em 2005, o Relatório de Avaliação de Software Genealógico foi avaliado (por Bill Mumford, que participou do Projeto original TestBook GEDCOM)[16] e incluiu testes do padrão GEDCOM 5.5 utilizando o programa Gedcheck.[17]

Para auxiliar na adoção do GEDCOM 7.0, agora existem ferramentas de validação específicas para esse padrão também.[18]

Exemplo[editar | editar código-fonte]

sample.ged
0 HEAD
1 SOUR PAF
2 NAME Personal Ancestral File
2 VERS 5.0
1 DATE 30 NOV 2000
1 GEDC
2 VERS 5.5
2 FORM LINEAGE-LINKED
1 CHAR ANSEL
1 SUBM @U1@
0 @I1@ INDI
1 NAME John /Smith/
1 SEX M
1 FAMS @F1@
0 @I2@ INDI
1 NAME Elizabeth /Stansfield/
1 SEX F
1 FAMS @F1@
0 @I3@ INDI
1 NAME James /Smith/
1 SEX M
1 FAMC @F1@
0 @F1@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 MARR
1 CHIL @I3@
0 @U1@ SUBM
1 NAME Submitter
0 TRLR

O cabeçalho (HEAD) inclui o programa de origem e sua versão (por exemplo, Personal Ancestral File, 5.0), a versão do GEDCOM (5.5), a codificação de caracteres (ANSEL), e um link para informações sobre o remetente do arquivo.

Os registros individuais (INDI) definem John Smith (ID I1), Elizabeth Stansfield (ID I2) e James Smith (ID I3).

O registro de família (FAM) vincula o marido (HUSB), esposa (WIFE) e filho (CHIL) pelos seus números de ID.

Versões[editar | editar código-fonte]

A versão atual da especificação amplamente utilizada é o GEDCOM 5.5.1 final, lançada em 15 de novembro de 2019. Seu predecessor, GEDCOM 5.5.1 draft,[19] foi emitido em 1999, introduzindo nove novos atributos e tags e adicionando UTF-8 como uma codificação de caracteres aprovada. O rascunho não foi formalmente aprovado, mas suas disposições foram adotadas em parte por vários programas de genealogia,[20][21][22] incluindo o FamilySearch.org.[19]

O GEDCOM ligado à linhagem é o denominador comum deliberado de facto. Apesar da versão 5.5 do padrão GEDCOM ter sido publicada pela primeira vez em 1996, muitos fornecedores de software genealógico nunca implementaram completamente o recurso de texto Unicode multilíngue (em vez do conjunto de caracteres ANSEL) introduzido com essa versão da especificação. O uso uniforme do Unicode permitiria o uso de conjuntos de caracteres internacionais. Um exemplo é o armazenamento de nomes do Leste Asiático em seus caracteres originais chineses, japoneses e coreanos (CJK), sem os quais poderiam ser ambíguos e de pouco uso para pesquisa genealógica ou histórica.[23] O PAF 5.2 é um exemplo de software que utiliza UTF-8 como seu conjunto de caracteres interno e pode gerar um GEDCOM UTF-8 como saída.[24]

O GEDCOM 7.0 requer codificação UTF-8[25] em todo o documento e resolve outros problemas antigos encontrados no GEDCOM 5.5.1. O suporte a multimídia na forma de um arquivo .zip associado, chamado GEDZip, é outra inclusão importante. Esforços estão em andamento para que o 7.0 seja adotado como o novo padrão de troca.[26] O GEDCOM 7.0 permite identificar explicitamente quais padrões além do GEDCOM podem ser aplicados a um arquivo específico. O GEDCOM sempre foi extensível, mas antes do 7.0 não havia uma maneira padrão de identificar essas extensões. Além disso, o GEDCOM 7.0 permite marcar explicitamente um evento como inexistente. Isso permite, por exemplo, documentar que um indivíduo específico nunca se casou.[27]

Referências[editar | editar código-fonte]

  1. a b Clarke, Gordon (7 de dezembro de 2021). «Media subtype name: vnd.familysearch.gedcom+zip». Internet Assigned Numbers Authority. Consultado em 1 de outubro de 2022 
  2. «FamilySearch GEDCOM». www.familysearch.org. Consultado em 5 de julho de 2024 
  3. Subject: rep: T Jenkins – open letter to GEDCOM-L – "The goal was to try and provide a standard to allow developers to provide a vehicle for their users to share genealogical conclusions and supporting evidence with others." From: "Jed R. Allen" Brigham Young University – Date: 29 Sep 1995 17:40:04 -0600 – GEDCOM-L Archives – September 1995, week 5 (#7)
  4. «Genealogical Software Report Card». Março de 2005. Cópia arquivada em 11 de fevereiro de 2009 
  5. GEDCOM 5.5 EL Arquivado em 2020-01-11 no Wayback Machine (Extended Locations) specification
  6. Ability to save information against places – "Support for parts of the GEDCOM 5.5EL proposal" – FHUG Wish List
  7. 0000688: Support for Gedcom 5.5EL Arquivado em 2011-07-26 no Wayback Machine – Gramps Bugtracker
  8. Nielsen, David (29 de março de 2022). «Apresentando o FamilySearch GEDCOM 7». FamilySearch. Consultado em 5 de julho de 2024 
  9. «The GEDCOM Standard Release 5.5: Data Model Chart». homepages.rootsweb.com. Consultado em 21 de julho de 2022 
  10. a b «The FamilySearch GEDCOM Specification». gedcom.io (em inglês). 7 de junho de 2022. Consultado em 21 de julho de 2022 
  11. «View of phpgedview's GEDCOM validator source code» [ligação inativa]
  12. «VGed 3.02». Rumble Fische. Cópia arquivada em 6 de janeiro de 2011 
  13. «FamilySearch FAQ». Consultado em 5 de julho de 2024 
  14. «GEDCOM TestBook Project». 2001. Cópia arquivada em 15 de junho de 2006 
  15. [GEDCOM and the GenTech Testbook Project] Genealogical Computing 7/1/2001 – Archive Summer 2001 Vol. 21.1 – Ancestry.com
  16. «NEOCAG : Message: Fw: Gen. Software Report Card in HTM». archive.ph. 8 de julho de 2012. Consultado em 5 de julho de 2024 
  17. «Bonfire Development, Inc. - Contact». www.bonfire.ca. Consultado em 5 de julho de 2024 
  18. «Tools for FamilySearch GEDCOM». FamilySearch GEDCOM (em inglês). Consultado em 21 de julho de 2022 
  19. a b Family History Department GEDCOM Coordinator (2 de outubro de 1999). «The GEDCOM Standard: Draft Release 5.5.1» (PDF). The Church of Jesus Christ of Latter-day Saints. Consultado em 1 de outubro de 2022 
  20. GED-GEN is based on GEDCOM version 5.5.1 (draft) Arquivado em 2009-02-03 no Wayback Machine, dated 2 October 1999. The following record types are parsed: header, individual, family, notes, source, and repository. However not all elements within these records are processed. – Specifications – GED-GEN Introduction
  21. 0000688: Support for Gedcom 5.5EL Arquivado em 2011-07-26 no Wayback Machine(0008068) romjerome (developer) 2009-01-25 06:13 – "Note : GRAMPS 3.0.x supports a part of GEDCOM 5.5.1 on export, which is not supported by most programs" – Gramps Bugtracker
  22. "MyBlood supports the GEDCOM 5.5 and 5.5.1 file format." Arquivado em 2009-06-05 no Wayback Machine – MyBlood Support – Forum, FAQ, Know Problems
  23. Personal Ancestral File 5.2 and PAF Companion 5.4 – Software Version Changes Arquivado em 2009-03-06 no Wayback Machine Release 5.0.1.4, 22 December 2000 – "10.GEDCOM improvements: Table:Destination:PAF 5 GEDCOM Version:5.5 Character Set:UTF-8
  24. Personal Ancestral File 5.1 Arquivado em 2007-07-21 no Wayback Machine – "Also noted in a second test was the use of four tags from a later draft version of the Gedcom specification, FONE (phonetic name), ROMN (romanized name), EMAIL (e-mail), and _UID" Jan/Feb 2002 NGS Newsmagazine
  25. «The FamilySearch GEDCOM Specification». gedcom.io (em inglês). 7 de junho de 2022. Consultado em 21 de julho de 2022 
  26. «Implementation Progress • Genealogy». Genealogy (em inglês). Consultado em 21 de julho de 2022 
  27. Smith, Richard (21 de julho de 2021). «FamilySearch GEDCOM 7». Family History Information Standards Organisation (em inglês). Consultado em 30 de janeiro de 2023. Cópia arquivada em 4 de agosto de 2021 

Ligações externas[editar | editar código-fonte]

Ícone de esboço Este artigo sobre Genealogia é um esboço. Você pode ajudar a Wikipédia expandindo-o.