10 de out. de 2013

Herbários de Recife discutem melhoria na qualidade dos dados

Visita promovida pelo CRIA e INCT-Herbário Virtual da Flora e dos Fungos dá continuidade ao trabalho de identificar os principais avanços e dificuldades dos herbários nacionais, discutindo a qualidade dos dados disponibilizados.

Da esquerda para direita: Gabriel Mendes (UFP), Alcina Viana (IPA), Cheysa Figueredo (IPA), Angela Miranda (HST), Marlene Barbosa (UFP), Maria Elizabeth (PEUFR), Rita Pereira (IPA) e Flávia Pezzini (CRIA/INCT-HVFF).

De 30 de setembro a 4 de outubro, a equipe do Centro de Referência em Informação Ambiental (CRIA) e do INCT-Herbário Virtual da Flora e dos Fungos (INCT-HVFF) reuniu em Recife curadores, técnicos e bolsistas dos herbários da região para discutir a melhoria da qualidade dos dados compartilhados através da rede speciesLink. Participaram cinco herbários de Recife que fazem parte da rede do INCT-HVFF: URM (Herbário Pe. Camille Torrand), UFP (Herbário Geraldo Mariz), IPA (Herbário Dárdano de Andrade Lima), HST (Herbário Sérgio Tavares) e PEUFR (Herbário Professor Vasconcelos Sobrinho). O URM representa a maior coleção de fungos herborizados na América Latina, com 84.500 registros, dos quais mais de 90% estão online. O UFP possui 58.540 registros de plantas principalmente do Nordeste, dos quais cerca de 60% estão online. O HST conta com um acervo de 19.681 registros, 100% online e 680 registros com imagens associadas. O PEUFR possui um acervo de 51.473 registros, dos quais cerca de 35% estão online. O IPA é a mais antiga fonte de informação sobre a flora do Nordeste e abriga cerca de 81.000 registros, dos quais cerca de 80% estão online.

Análise conjunta da ferramenta dataCleaning para dignosticar erros e direcionar a correção.

A visita dá continuidade ao trabalho de identificar os principais avanços e dificuldades de cada herbário, discutindo a padronização e qualidade dos dados ao realizar uma análise conjunta do relatório dataCleaning. Esse contato próximo com os curadores, técnicos e bolsistas contribui muito para os familiarizar mais com a ferramenta e fazer uma análise comparativa dos erros de cada herbário. A ferramenta dataCleaning procura evidenciar os dados que podem conter erros, por exemplo, em relação às informações gerenciais de curadoria (número de tombo, registros repetidos), aos dados taxonômicos (erros de grafia, diferentes nomes de autor para a mesma espécie), à data (ano de identificação anterior ao da coleta, ano de coleta maior do que a última atualização) ou aos dados de georeferenciamento (ausência de sinal em latitudes ou longitudes negativas, coordenadas que caem no mar).

Herbário UFP, que abriga registros de plantas principalmente da região Nordeste.

Todos os herbários participantes frequentemente atualizam os dados enviados ao speciesLink e estão fortemente empenhados em sua correção. Por exemplo, para todos eles não há mais registros suspeitos relacionados a erros de grafia para Famílias e Gêneros. Além desse diagnóstico, os participantes levantaram questões importantes como a atualização dos nomes de estados e municípios (por exemplo, devemos atualizar o estado para as coletas feitas em Tocantins antes da sua criação?) e a padronização dos nomes dos coletores e determinadores. Sugestões para essas questões podem ser consultadas no repositório de documentos do speciesLink [disponível aqui]. Esses documentos foram desenvolvidos pela equipe do CRIA após a Conferência Internacional: o INCT Herbário Virtual da Flora e dos Fungos e e-infraestruturas para Biodiversidade, ocorrida em setembro de 2012 na qual todos os herbários estavam presentes.

Leonor Costa Maia, coordenadora do INCT-HVFF e curadora do URM, e João Batista de Oliveira, biólogo do URM.

Outro ponto que merece atenção está relacionado a um dos formatos utilizado pelo BRAHMS, adotado por algumas coleções participantes, para inserir coordenadas geográficas. Existe um artifício criado pelos programadores para anotar informações sobre as coordenadas geográficas que pode gerar confusão. O BRAHMS permite a entrada de dados no formato de GMS (graus, minutos e segundos) por meio de um formato intermediário que se assemelha ao formato de GD (graus decimais), mas que o BRAHMS interpreta como formato GMS. Isso reduz a necessidade de incluir símbolos que costumam gerar erros, mas se não for devidamente informado pode gerar uma interpretação errônea.


Para ver mais fotos das visitas aos herbários, clique aqui. 

Saiba mais!

Texto e Fotos - Ricardo Braga Neto e Flávia Pezzini

Nenhum comentário:

Postar um comentário