The future is here! A indexação automatizada já é uma realidade.

Desde o fim de 2021, venho notando nas pesquisas de registros do FamilySearch (www.familysearch.org/search) a presença de resultados “estranhos”, com erros verdadeiramente grotescos. Aqui vão dois exemplos ao acaso:

1) CASO 1: https://www.familysearch.org/ark:/61903/1:1:68VS-3DG5

2) CASO 2: https://www.familysearch.org/ark:/61903/1:1:68VM-QQWV

No primeiro caso, o nome da falecida foi indexado como “JOSERHA LACEIARINHIRMAMORI”, quando na realidade é “JOSEFA LACHARIM HERNANDES”. No segundo, o falecido consta “DERIOX LIMENES Antos”, quando o defunto era “GERSON GIMENES CAMPOS”.

Esse tipo de erro chamou minha atenção e logo comentei com meu amigo Gustavo Pedroso, do blog Genealogices (www.genealogices.wordpress.com), que isso parecia ser obra de indexação feita por computador com o uso da tecnologia OCR (o reconhecimento óptico de caracteres). Naquele momento não me aprofundei e “deixei pra lá”. Depois comecei a notar que o número de resultando estava aumentando consideravelmente, todos oriundos de indexações por OCR de “declarações de óbito” do estado de São Paulo, como aquela da saudosa cantora Elis Regina que ilustra este artigo (para vê-la em detalhes: clique aqui).

Hoje, por fim, percebi que não apenas declarações de óbito estavam sendo objeto de indexação por OCR, mas também assentos de batismo do estado de São Paulo. Deparei-me com o registro de batismo de João Spina, pai do importante filólogo e romanista Segismundo Spina, professor emérito da USP.

 

Para ter acesso à ficha da indexação, clique aqui. Como vocês podem notar, alguns elementos do registro estão evidenciados em azul, como a data do registro, a data de nascimento e o nome do batizado. Curiosamente, o resultado da indexação automatizada desse registro escrito em letra cursiva (muito legível, diga-se) ficou muito bom!

Esses resultados não aparecem nos “registros sugeridos” na árvore familiar do FamilySearch. É necessário fazer a busca normal na página correspondente (www.familysearch.org/search). Eu normalmente uso a página específica do Brasil quando estou procurando registros que sei terem sido produzidos no Brasil. O link direto é este: www.familysearch.org/search/collection/location/1927159.

Considero que a tecnologia é muito bem-vinda também na indexação. É uma nova fronteira que promete grande resultados! Para quem ama genealogia, dá até um frio na espinha. Todavia, tenho que deixar aqui duas críticas, que infelizmente o FamilySearch nunca ouviria, pois não são abertos a esse tipo de input externo.

  1. Os resultados das indexações feitas por OCR deveriam no mínimo ser mais bem sinalizados para que o pesquisador perceba. Deveria haver a possibilidade de ativar e desativar os resultados de indexações por OCR num primeiro momento, tendo em vista o alto índice de problemas. Simplesmente “despejar” milhares, quiçá milhões, de resultados junto com a busca ordinária acaba por inquinar a busca. Um botão “ON/OFF” seria o ideal.
  2. As milhares e milhares de declarações de óbito do estado de São Paulo foram lançadas na coleção “Brasil, São Paulo, Registro Civil, 1925-1995”. Ora, declarações de óbito não são registro civil, mas um documento médico-legal. Deveria ter sido criada um outro fundo (coleção) para abrigar esses documentos. Já disse isso antes: o FamilySearch precisa de um bom arquivista na direção dos seus projetos para auxiliar a catalogação desses fundos. Os princípios mais básicos da Arquivísitca são simplesmente ignorados pelo FamilySearch e isso é ruim. Quem lida com documentos precisa ter o auxílio da disciplina científica que já existe para organizar essa imensa quantidade de informação. Pode parecer simples “perfumaria“, mas não é, vide o caso dos “cartões de imigração”, cujo nome errado leva muitos pesquisadores eventuais a elucubrar interpretações equivocadas sobre a história de seus ascendentes imigrantes.

Enfim, o agradecimento ao FamilySearch será eterno. O benefício que recebemos é infinitamente superior a qualquer crítica ou sugestão que tenhamos a fazer. Gosto sempre de deixar isso bem claro. Com a indexação automatizada, milhões e milhões de registros podem vir à tona, permitindo a abertura de novas fronteiras na genealogia. O entusiamo é grande! Ad maiora semper.


PUBLICIDADE

Gostou? Deixe seu comentário: