14 de ago de 2013

Visitas às coleções de Sergipe e da Bahia

Nos próximos 15 dias, diversos herbários de Sergipe e da Bahia receberão a visita da bolsista do INCT Herbário Virtual da Flora e dos Fungos responsável pela qualidade dos dados.


Alunos do laboratório de Liquenologia (LALIC) com a professora Dra. Marcela Cáceres no campus Professor Alberto Carvalho da UFS, em Itabaiana - SE. O Herbário ISE possui cerca 16.000 registros de líquens e pertence a rede INCT - HVFF desde o início de 2013.
O herbário ISE, de Itabaiana - SE foi o primeiro a ser visitado nos dia 13 e 14/08/2013. Até dia 28/08, a bolsista percorrerá as cidade de Itabaiana (SE), Salvador, Cruz das Almas, Feira de Santana, Jequié e Ilhéus (todas na BA), visitando mais de 9 herbários. O objetivo é realizar uma análise conjunta do relatório dataCleaning, discutir a qualidade dos dados e conhecer os principais avanços e as principais dificuldades dos herbários. A melhoria da qualidade dos dados é uma preocupação constante tanto do INCT-HVFF quanto do CRIA, e bons resultados tem sido alcançados graças aos eventos de treinamento, ao uso das ferramentas e ao enorme empenho dos responsáveis pelos acervos.

Acompanhe as notícias sobre as visitas pelo Facebook do CRIA e também pelo Twitter.

6 de ago de 2013

Ferramenta dataCleaning da rede speciesLink é citada na revista TREE

O artigo “Biodiversity data should be published, cited, and peer reviewed”, publicado na edição de agosto de 2013 na revista Trends in Ecology & Evolution (TREE), cita a rede speciesLink como pioneira na produção de métricas úteis para melhorar a qualidade dos dados disponíveis.



O trabalho publicado por Mark J. Costello e colaboradores sugere que a publicação de dados brutos deve seguir o modelo de publicação de artigos e a qualidade desses dados garantida por meio de processos automatizados de verificação de qualidade, revisão por pares e decisões editoriais. Os autores discutem meios de incentivar a publicação dos dados, assim como melhorar a integração com outros conjuntos de dados.

A publicação de dados aumenta a visibilidade de resultados científicos. Segundo os autores, infraestrutura e capacidade de armazenamento já existem para dados de biodiversidade, mas sua taxa de publicação, mesmo em crescimento, ainda é menor do que a esperada. Além disso, pouca atenção tem sido dada à qualidade dos dados que já foram disponibilizados. A melhoria da qualidade dos dados é importante para garantir sua maior acurácia, diminuir o tempo de manejo pelo usuário e aumentar sua taxa de reuso.

Distribuição geográfica dos pontos de ocorrência dos espécimes coletados ou observados mantidos nas coleções participantes da rede speciesLink.

Em relação à qualidade, o artigo propõe um processo em etapas de controle e garantia de qualidade de dados antes da publicação, que inclui ferramentas automáticas. Como exemplo, os autores citam a rede speciesLink, que através da ferramenta dataCleaning disponibiliza aos usuários métricas relacionadas ao número de registros, espécies e localidades geográficas, validação de nomes, e completude dos dados e metadados.

A rede speciesLink, que no mês de julho de 2013 superou o marco de 6 milhões de registros de ocorrência de espécies da flora, fauna e microbiota, juntamente com o INCT Herbário Virtual da Flora e dos Fungos (INCT-HVFF) têm trabalhado nesse desafio da melhoria da qualidade dos dados utilizando um conjunto de aplicativos que compõe a ferramenta dataCleaning. O trabalho de correção dos erros e de aumento da qualidade dos dados da rede speciesLink tem sido aprimorado graças aos eventos de treinamento, ao uso das ferramentas e ao enorme empenho dos responsáveis pelos acervos.

Veja o artigo completo, que é de livre acesso:
Mark J. Costello, William K. Michener, Mark Gahegan, Zhi-Qiang Zhang, Philip E. Bourne. Biodiversity data should be published, cited, and peer reviewed. Trends in Ecology & Evolution - 1 August 2013 (Vol. 28, Issue 8, pp. 454-461). [link].

Saiba mais!

1 de ago de 2013

Rede speciesLink supera 6 milhões de registros online

No mês de julho de 2013 a rede speciesLink superou o marco de 6 milhões de registros de ocorrência de espécies da flora, fauna e microbiota, disponíveis online de forma livre e aberta a qualquer pessoa interessada.




São cerca de 300 coleções e subcoleções biológicas e dez provedores de dados de observação contribuindo com informações não sensíveis de seus acervos para aumentar o conhecimento sobre a biodiversidade brasileira. Mais de 600.000 registros são dados repatriados e novos registros são acrescentados diariamente.


Médias mensais do número total de registros online, do número de registros georreferenciados e de provedores de dados.

Cerca de 70% dos registros online provêm de herbários, 25% de coleções de animais, 0,2% de microrganismos, 0,1% fósseis e 5,2% de coleções abrangentes. 33% dos dados são oriundos de coletas feitas na região Sudeste, 22% no Nordeste, 19% no Sul, 17% na região Norte e 9% na região Centro-Oeste. Hoje, apenas o estado do Amapá não possui nenhum acervo local integrado à rede, dependendo 100% dos dados de instituições de outros estados.

Proporção por região geográfica do Brasil entre o número de registros online da rede speciesLink. Os valores indicam o número de registros por km2 por região.


Qualidade e usabilidade dos dados
Em relação às coordenadas geográficas, cerca de 2 milhões de registros possuem coordenadas consistentes e 470 mil possuem coordenadas inconsistentes – a coordenada geográfica informada não cai na área geográfica do município informado. Para aumentar a usabilidade dos dados, 2,2 milhões dos registros foram georreferenciados por um aplicativo baseado na informação sobre o município de ocorrência. Cerca de 1,3 milhão de registros não têm coordenadas geográficas e nem referência ao município.

Coordenadas geográficas de todos os registros georeferenciados.

Comparando os nomes das espécies com diferentes dicionários e checklists, tem-se que mais de 3,5 milhões de registros são de nomes aceitos e pouco mais de 400 mil de sinônimos. O nome da espécie de mais de um milhão de registros não foi encontrado nas listas de referência, sendo que mais de 850 mil registros não têm a identificação da espécie.

Graças ao projeto Reflora, os herbários estão associando imagens aos dados textuais por meio do sistema Exsiccatae. São mais de 200 mil imagens dos vouchers, seis mil de material vivo e mil e trezentas de pólen. Além dessa, várias ferramentas, todas de acesso aberto, estão disponíveis para diferentes tipos de análises, dentre as quais destacamos:


•    Interface de busca - www.splink.org.br
•    Indicadores - splink.cria.org.br/indicators/
•    DataCleaning - splink.cria.org.br/dc
•    Lacunas - lacunas.inct.florabrasil.net
•    BioGeo - biogeo.inct.florabrasil.net

Esses resultados evidenciam, no Brasil, que a disponibilização de dados sobre a biodiversidade está aumentando de forma consistente, refletindo uma mudança cultural e o fomento de políticas públicas. Acima de tudo, eles são fruto de um trabalho em rede em que a contribuição de cada provedor de dados é essencial. Por isso, gostaríamos de agradecer a todos que contribuem para o desenvolvimento da rede speciesLink.

Muito obrigado!