29 de ago. de 2019

Status dos nomes científicos na rede speciesLink


A rede speciesLink, desde o seu início, tem uma preocupação muito grande com a qualidade dos dados que publica. Entende que compete aos curadores corrigirem eventuais erros ou inconsistências dos dados de seus acervos, mas cabe ao CRIA desenvolver ferramentas para auxiliar os curadores na detecção desses erros e inconsistências, e para atestar a qualidade dos dados para os usuários.

Uma ferramenta desenvolvida nos últimos anos compara os nomes científicos de cada registro, com os nomes em listas de referência ou dicionários. O nome científico de cada registro recebe uma etiqueta (tag), indicando tratar-se de um nome aceito, sinônimo, ambíguo ou não encontrado. Um nome é considerado ambíguo quando, em um mesmo dicionário, ele possui mais de um status.

Até o dia 22 de agosto de 2019, essa checagem do nome era feita sempre que os dados de um acervo eram atualizados. Assim, se houvesse uma alteração no status do nome nos dicionários, a rede speciesLink poderia indicar diferentes status para esse nome – aceito, sinônimo, ambíguo ou não encontrado – dependendo da data de atualização dos dados nas diferentes coleções.

Recentemente, foi solicitado ao CRIA a inclusão de mais duas referências: AlgaeBase e MycoBank. Além da inclusão dessas referências, alteramos o procedimento de atualização do status dos nomes. O procedimento passa a ser a atualização do status de todos os registros da rede speciesLink sempre que algum dicionário for atualizado.


Os dados do AlgaeBase e parte do MycoBank foram integrados ao sistema e o status dos nomes de cada registro da rede speciesLink foi atualizado.


A ordem do uso das referências é importante. Se o nome de uma espécie for encontrado na primeira referência, ele não será checado nas demais. Portanto, o nome de um registro terá o status determinado pela primeira referência em que for encontrado.

As referências e a ordem utilizada para os diferentes grupos são:
  • Para fungos (registro com o campo Reino = Fungi): MycoBank, Catálogo da Vida e Flora do Brasil 2020;
  • Para plantas e algas (registro com campo Reino = Plantae ou coleção associada ao INCT-Herbário Virtual da Flora e dos Fungos): AlgaeBase, MycoBank, Flora do Brasil 2020 e o Catálogo da Vida;
  • Para animais (registro com campo Reino = Animalia ou coleção associada ao grupo Animais): Catálogo de Abelhas Moure e o Catálogo da Vida;
  • Para microrganismos (coleções associadas à rede SIColNet): o dicionário Prokaryotic Nomenclature Up-to-date da DSMZ e o Catálogo da Vida;
  • Para outros casos: o Catálogo da Vida.

A tabela a seguir apresenta uma síntese dos resultados, comparando o status no dia 22 de agosto de 2019 com o dia 26 de agosto de 2019, quando essas novas referências foram integradas ao sistema e todos os nomes de espécies do banco de dados da rede speciesLink reavaliados.


Tem-se dois efeitos na evolução desses números: a inclusão das novas referências (AlgaeBase e MycoBank) e a atualização do status de todos os registros na rede speciesLink. As novas referências promoveram um aumento do número de registros tanto de espécies com nomes aceitos, quanto de seus sinônimos. Considerando todos os 9,7 milhões de registros, houve um aumento de 3% no número de registros com nomes aceitos e de 9% dos sinônimos.

A tabela a seguir mostra o número de nomes utilizados de cada referência para indicar o status dos nomes dos registros da rede speciesLink.

Referências (em ordem alfabética):