A rede speciesLink,
desde o seu início, tem uma preocupação muito grande com a qualidade dos dados
que publica. Entende que compete aos curadores corrigirem eventuais erros ou
inconsistências dos dados de seus acervos, mas cabe ao CRIA desenvolver
ferramentas para auxiliar os curadores na detecção desses erros e
inconsistências, e para atestar a qualidade dos dados para os usuários.
Uma ferramenta desenvolvida nos últimos anos compara os
nomes científicos de cada registro, com os nomes em listas de referência ou
dicionários. O nome científico de cada registro recebe uma etiqueta (tag), indicando tratar-se de um nome aceito, sinônimo, ambíguo ou não encontrado. Um nome é considerado
ambíguo quando, em um mesmo dicionário, ele possui mais de um status.
Até o dia 22 de agosto de 2019, essa checagem do nome era
feita sempre que os dados de um acervo eram atualizados. Assim, se houvesse uma
alteração no status do nome nos dicionários, a rede speciesLink poderia indicar diferentes status para esse nome –
aceito, sinônimo, ambíguo ou não encontrado – dependendo da data de atualização
dos dados nas diferentes coleções.
Recentemente, foi solicitado ao CRIA a inclusão de mais duas
referências: AlgaeBase e MycoBank. Além da inclusão dessas
referências, alteramos o procedimento de atualização do status dos nomes. O
procedimento passa a ser a atualização do status de todos os registros da rede speciesLink sempre que algum dicionário
for atualizado.
Os dados do AlgaeBase
e parte do MycoBank foram integrados
ao sistema e o status dos nomes de cada registro da rede speciesLink foi atualizado.
A ordem do uso das referências é importante. Se o nome de
uma espécie for encontrado na primeira referência, ele não será checado nas demais.
Portanto, o nome de um registro terá o status determinado pela primeira
referência em que for encontrado.
As referências e a ordem utilizada para os diferentes grupos
são:
- Para fungos (registro com o campo Reino = Fungi): MycoBank, Catálogo da Vida e Flora do Brasil 2020;
- Para plantas e algas (registro com campo Reino = Plantae ou coleção associada ao INCT-Herbário Virtual da Flora e dos Fungos): AlgaeBase, MycoBank, Flora do Brasil 2020 e o Catálogo da Vida;
- Para animais (registro com campo Reino = Animalia ou coleção associada ao grupo Animais): Catálogo de Abelhas Moure e o Catálogo da Vida;
- Para microrganismos (coleções associadas à rede SIColNet): o dicionário Prokaryotic Nomenclature Up-to-date da DSMZ e o Catálogo da Vida;
- Para outros casos: o Catálogo da Vida.
A tabela a seguir apresenta uma síntese dos resultados,
comparando o status no dia 22 de agosto de 2019 com o dia 26 de agosto de 2019, quando essas novas referências foram integradas ao sistema e todos os nomes de espécies do banco de dados da rede speciesLink reavaliados.
Tem-se dois efeitos na evolução desses números: a inclusão das
novas referências (AlgaeBase e MycoBank) e a atualização do status de
todos os registros na rede speciesLink.
As novas referências promoveram um aumento do número de registros tanto de
espécies com nomes aceitos, quanto de seus sinônimos. Considerando todos os 9,7
milhões de registros, houve um aumento de 3% no número de registros com nomes
aceitos e de 9% dos sinônimos.
A tabela a seguir mostra o número de nomes utilizados de
cada referência para indicar o status dos nomes dos registros da rede speciesLink.
Referências (em ordem alfabética):
- AlgaeBase (www.algaebase.org)
- Catálogo de Abelhas Moure (moure.cria.org.br)
- Catálogo da Vida (catalogueoflife.org)
- Flora do Brasil 2020 (floradobrasil.jbrj.gov.br)
- MycoBank (www.mycobank.org)
- Prokaryotic Nomenclature Up-to-date da DSMZ (www.dsmz.de/services/online-tools/prokaryotic-nomenclature-up-to-date)