23 de jan. de 2014

Novidades na ferramenta Duplicata do dataCleaning

Novos filtros e agrupamentos dos dados facilitam a identificação de determinações distintas para duplicatas de plantas em diferentes herbários. A ferramenta Duplicata visa auxiliar curadores e técnicos de herbários a identificar e corrigir erros e a atualizar e completar os dados.


Exsicatas da mesma coleta depositadas em herbários diferentes podem ter identificações distintas. A exsicata depositada no herbário FLOR (à esquerda) representa a coleta número 10806 de J. Mattos realizada em 15 de dezembro de 1962 em Conceição da Barra, Espírito Santo, Brasil. A exsicata do mesmo material depositada em SP (à direita) foi identificada como Eugenia hirta O.Berg. por M. Sobral em setembro de 1991, mas a duplicata de FLOR permanece sem atualização da identificação inicial.
 
Durante visitas promovidas pelo CRIA e INCT-Herbário Virtual da Flora e dos Fungos para discutir a qualidade dos dados disponibilizados online, curadores e técnicos dos herbários sugeriram algumas melhorias que foram implementadas recentemente. Essas melhorias incluem novos filtros e formas de visualização do relatório, e, quando disponível, a apresentação da imagem da exsicata. Registros "suspeitos" detectados pela ferramenta Duplicata são aqueles que possuem o mesmo nome, número de coletor e data de coleta, mas informações distintas nos campos "gênero + espécie + subespécie".

Um dos grandes problemas na identificação de duplicatas nos diferentes herbários através de um aplicativo era a falta de padronização do nome do coletor. A ferramenta agora reconhece variações na ordem da escrita do nome e iniciais dos coletores. Por exemplo, D. Alvarenga é reconhecido como sendo o mesmo que Alvarenga, D.. O sistema também reconhece como sendo o mesmo o coletor isolado ou o coletor principal quando registrado juntamente com os coletores secundários. Por exemplo, A.A. Ribeiro-filho é considerado isoladamente ou quando associado com outros coletores, como no caso A.A. Ribeiro-filho, L.C. Soares. 


A tabela apresentada pode ser ordenada por nome do coletor, família ou gênero, facilitando o trabalho do curador que quiser analisar os dados por família, por exemplo. Cada linha é clicável e permite navegação dinâmica. A tabela apresenta também o nome do determinador e data de determinação, assim como novos filtros como família ou gênero indeterminados para que seja possível rapidamente comparar esses registros com duplicatas de outros herbários participantes da rede speciesLink.

Esperamos com isso facilitar o trabalho de atualização da nomenclatura taxonômica dos acervos. Com o uso da ferramenta, herbários que não possuem especialistas de determinados grupos taxonômicos podem se beneficiar do trabalho de identificação do material em outros herbários e, dessa forma, contribuir para a melhora da qualidade dos dados da rede do Herbário Virtual.

 

Saiba mais!