29 de ago. de 2019

Status dos nomes científicos na rede speciesLink


A rede speciesLink, desde o seu início, tem uma preocupação muito grande com a qualidade dos dados que publica. Entende que compete aos curadores corrigirem eventuais erros ou inconsistências dos dados de seus acervos, mas cabe ao CRIA desenvolver ferramentas para auxiliar os curadores na detecção desses erros e inconsistências, e para atestar a qualidade dos dados para os usuários.

Uma ferramenta desenvolvida nos últimos anos compara os nomes científicos de cada registro, com os nomes em listas de referência ou dicionários. O nome científico de cada registro recebe uma etiqueta (tag), indicando tratar-se de um nome aceito, sinônimo, ambíguo ou não encontrado. Um nome é considerado ambíguo quando, em um mesmo dicionário, ele possui mais de um status.

Até o dia 22 de agosto de 2019, essa checagem do nome era feita sempre que os dados de um acervo eram atualizados. Assim, se houvesse uma alteração no status do nome nos dicionários, a rede speciesLink poderia indicar diferentes status para esse nome – aceito, sinônimo, ambíguo ou não encontrado – dependendo da data de atualização dos dados nas diferentes coleções.

Recentemente, foi solicitado ao CRIA a inclusão de mais duas referências: AlgaeBase e MycoBank. Além da inclusão dessas referências, alteramos o procedimento de atualização do status dos nomes. O procedimento passa a ser a atualização do status de todos os registros da rede speciesLink sempre que algum dicionário for atualizado.


Os dados do AlgaeBase e parte do MycoBank foram integrados ao sistema e o status dos nomes de cada registro da rede speciesLink foi atualizado.


A ordem do uso das referências é importante. Se o nome de uma espécie for encontrado na primeira referência, ele não será checado nas demais. Portanto, o nome de um registro terá o status determinado pela primeira referência em que for encontrado.

As referências e a ordem utilizada para os diferentes grupos são:
  • Para fungos (registro com o campo Reino = Fungi): MycoBank, Catálogo da Vida e Flora do Brasil 2020;
  • Para plantas e algas (registro com campo Reino = Plantae ou coleção associada ao INCT-Herbário Virtual da Flora e dos Fungos): AlgaeBase, MycoBank, Flora do Brasil 2020 e o Catálogo da Vida;
  • Para animais (registro com campo Reino = Animalia ou coleção associada ao grupo Animais): Catálogo de Abelhas Moure e o Catálogo da Vida;
  • Para microrganismos (coleções associadas à rede SIColNet): o dicionário Prokaryotic Nomenclature Up-to-date da DSMZ e o Catálogo da Vida;
  • Para outros casos: o Catálogo da Vida.

A tabela a seguir apresenta uma síntese dos resultados, comparando o status no dia 22 de agosto de 2019 com o dia 26 de agosto de 2019, quando essas novas referências foram integradas ao sistema e todos os nomes de espécies do banco de dados da rede speciesLink reavaliados.


Tem-se dois efeitos na evolução desses números: a inclusão das novas referências (AlgaeBase e MycoBank) e a atualização do status de todos os registros na rede speciesLink. As novas referências promoveram um aumento do número de registros tanto de espécies com nomes aceitos, quanto de seus sinônimos. Considerando todos os 9,7 milhões de registros, houve um aumento de 3% no número de registros com nomes aceitos e de 9% dos sinônimos.

A tabela a seguir mostra o número de nomes utilizados de cada referência para indicar o status dos nomes dos registros da rede speciesLink.

Referências (em ordem alfabética):



15 de jul. de 2019

Lacunas de conhecimento das abelhas no Brasil

Divulgamos o lançamento de uma nova ferramenta para avaliar as lacunas de dados e conhecimento das abelhas neotropicais que ocorrem no Brasil. O desenvolvimento desse sistema é um produto do projeto "Consolidação da e-infraestrutura de dados abertos sobre a diversidade das abelhas nativas do Brasil" (Processo: 400580/2018-7), financiado pelo CNPq e pela associação A.B.E.L.H.A. e coordenado pelo Prof. Eduardo Andrade Botelho de Almeida da USP, Ribeirão Preto.

São utilizadas como fontes de dados a rede speciesLink e o Catálogo de Abelhas Moure. Esse sistema utiliza como referência o sistema Lacunas de Conhecimento da Flora e dos Fungos do Brasil, lançado em setembro de 2012 no contexto do Instituto Nacional da Flora e dos Fungos (INCT) com o apoio do CNPq.

O objetivo é apresentar o status dos dados online para todas as espécies válidas do Catálogo Moure, inclusive listando aquelas que não possuem registros na rede speciesLink. O sistema segue a hierarquia taxonômica apresentada no Catálogo Moure e também permite a busca pelo nome de uma espécie.


Ao selecionar uma subfamília, por exemplo Apinae, o sistema apresenta um gráfico com quatro colunas: (1) com o número de espécies que não têm registros na rede speciesLink (2) com as que têm entre 1 a 5 registros; (3) com 6 a 20 registros; e, (4) com mais de 20 registros, sempre de acordo com o critério de busca adotado.


Esse agrupamento de acordo com o número de registros disponíveis na rede speciesLink, procura indicar o potencial do uso dos dados na elaboração de modelos de distribuição geográfica exploratórios (até 5 pontos distintos de ocorrência), preliminares (entre 6 a 20 pontos) ou consistentes (com mais de 20 pontos).

A cor castanha indica o número de espécies do Catálogo Moure para as quais não há citação de ocorrência no Brasil e, a cor verde, as que o Catálogo cita a ocorrência no Brasil.

Quanto aos critérios de busca, o usuário pode optar por só usar os nomes aceitos ou os aceitos e seus sinônimos, a busca exata ou fonética, e pode-se considerar todos os registros com ou sem coordenadas geográficas ou selecionar apenas os registros com coordenadas consistentes e distintas. A inclusão das coordenadas normalmente reduz o número de espécies com registros que atende esse critério.


Ainda no nível de subfamílias é possível identificar as lacunas geográficas por estado de ocorrência. Nesse caso, só estão sendo consideradas as espécies, cujas ocorrências nos estados brasileiros são citadas no Catálogo Moure.


O sistema mostra o número de espécies da subfamília Apinae reportadas no Catálogo Moure como ocorrendo nos estados indicados, mas que não apresentam registros na rede speciesLink. Clicando no estado de Sergipe, por exemplo, o sistema apresenta uma lista dessas espécies:


A mesma análise é feita para cada tribo e gênero, só que a partir da tribo a lista das espécies é apresentada. Selecionando a tribo Bombini e adotando o critério de busca mais abrangente (incluir sinônimos, busca fonética, com ou sem coordenadas geográficas), obtém-se um resultado muito interessante que pode tanto contribuir para a inclusão de informações sobre a ocorrência geográfica no Catálogo Moure, como também pode orientar novas coletas. O sistema mostra a espécie Bombus pullatus com 303 registros, sendo que o Catálogo Moure não cita sua ocorrência no Brasil. O sistema mostra mapas comparativos dos estados de ocorrência da espécie no Catálogo Moure e na rede speciesLink.


Mostra também o número de registros por ano de coleta, o que pode indicar lacunas temporais.


Só para mostrar outro exemplo onde um sistema pode se beneficiar da informação do outro, para a espécie Bombus transversalis (Olivier, 1789), tem-se a seguinte informação de distribuição no Lacunas:


Nesse caso a rede speciesLink indica a ocorrência nos estados de Roraima, Goiás e Paraná, não indicadas no Catálogo Moure; por outro lado o Catálogo indica a ocorrência no estado de Mato Grosso, para o qual a rede speciesLink não tem dados. Cabe aos especialistas avaliarem se os dados dos registros do speciesLink estão corretos.

Para Algas, Fungos e Plantas, o sistema Lacunas têm auxiliado a comunidade botânica na definição de estratégias de coleta, de digitação e de integração de dados de novos acervos à rede speciesLink.

Toda crítica ou sugestão é bem-vinda.

Lacunas de conhecimento das abelhas no Brasil: http://moure.cria.org.br/lacunas

3 de jul. de 2019

INCT – Herbário Virtual da Flora e dos Fungos: Imagens


Enquanto a equipe do CRIA, nos últimos meses focava o seu trabalho na transferência dos sistemas hospedados no Internet Data Center (IDC/RNP) para o Centro de Dados Compartilhados da Rede Nacional de Ensino e Pesquisa (CDC/RNP) em Recife, os herbários parceiros da rede speciesLink trabalhavam na digitação e correção dos dados e na digitalização de seus espécimes. Esse post procura mostrar o processo e a evolução do número de imagens compartilhadas, com destaque ao primeiro semestre do ano de 2019.

Imagens agregam um enorme valor às coleções biológicas. O apoio ao desenvolvimento do serviço de imagens do INCT-Herbário Virtual foi aprovado pelo CNPq em dezembro de 2010, e o serviço foi lançado em maio de 2011 com 9,2 mil imagens. 

Cada herbário tem sua metodologia e equipamentos para a produção de imagens. O diagrama a seguir mostra o processo de recebimento e integração das imagens à rede speciesLink.


Além do trabalho de digitalização e documentação de cada espécime, há o trabalho de envio, conversão de formato, verificação visual e ajustes, controle de imagens repetidas e atualização do banco de imagens e do banco de dados. 

As imagens de espécimes de algas, fungos e plantas representam 99,6% das imagens da rede speciesLink. Outros grupos que compartilham imagens são abelhas, peixes e microrganismos. Esses grupos se beneficiaram do desenvolvimento realizado no contexto do INCT-Herbário Virtual da Flora e dos Fungos, com o apoio do CNPq. 

O gráfico a seguir mostra a evolução do número de imagens enviadas ao CRIA. 



O INCT-Herbário Virtual fechou o ano de 2018 compartilhando cerca de 2,2 milhões de imagens, sendo 1,8 milhão de imagens de vouchers, 45 mil de material vivo, 3 mil de pólen e 300 mil de etiquetas. Hoje, dia 3 de julho de 2019, o INCT-Herbário Virtual compartilha mais de 2,55 milhões de imagens, sendo cerca de 2,2 milhões de imagens de vouchers, 47 mil de material vivo e 3 mil de pólen e 300 mil de etiquetas. De 1.875.621 registros com imagens no final de 2018, o INCT-Herbário Virtual passa a servir 2.130.048 registros com imagens.

Ao todo, 77 conjuntos de dados compartilham imagens associadas aos dados textuais, sendo que 6 iniciaram o envio de imagens esse ano. Ao todo 40 conjuntos de dados enviaram novas imagens em 2019. O grande destaque do semestre foi o Museu Botânico Municipal de Curitiba, que nesse período enviou mais de 368 mil imagens. São pouco mais de 257 mil registros com imagens, sendo 1.865 de typus.

O compartilhamento das imagens associadas aos dados textuais das amostras coletadas permite a validação da determinação por terceiros e representa uma importante ferramenta para pesquisa e ensino. 

Esse ano já foram utilizados cerca de 285 milhões de registros via interface de busca e mais de 1,7 milhão de imagens. Esses números representam um uso diário de mais de 1,5 milhão de registros e 9,4 mil imagens

Parabéns a todos os herbários e aos usuários da rede speciesLink, que, além de suas pesquisas e serviços, contribuem para o aprimoramento dos dados e dos sistemas, identificando material, corrigindo erros e enviando novas demandas.








30 de mai. de 2019

speciesLink no CDC da RNP

No final de 2018, com a celebração do 20º. termo aditivo ao Contrato de Gestão entre o MCTIC e a RNP, foi dado um importante passo para assegurar a permanência da e-infraestrutura speciesLink. Esse termo aditivo assegura o apoio da RNP na migração dos sistemas que compõem a rede speciesLink para a infraestrutura em nuvem no Centro de Dados Compartilhados em Recife. Em abril concluímos a transferência de todos os sistemas públicos de informação, dados, ferramentas e aplicativos desenvolvidos e mantidos pelo CRIA para esse Centro. Portanto, os sistemas agora estão em um ambiente seguro com hardware compatível com as suas necessidades.

Gostaríamos de deixar os nossos agradecimentos por todo apoio recebido e pela compreensão daqueles que precisaram do nosso suporte técnico nos últimos seis meses. Essa transferência demandou muito trabalho de uma equipe que é muito reduzida, o que em determinados momentos aumentou o nosso tempo de resposta às demandas dos nossos parceiros.

Como marco do início dessa nova etapa, preparamos um documento síntese sobre a rede speciesLink, uma rede de informação colaborativa sobre a biodiversidade brasileira que disponibilizamos para que os interessados possam ter uma visão mais ampla sobre essa importante e-infraestrutura de acesso livre e aberto a todos.

Novamente muito obrigada por toda colaboração!

equipe do CRIA

27 de mai. de 2019

Novidades no sistema Lacunas

O sistema Lacunas de conhecimento da flora e dos fungos do Brasil, lançado em 2012, tem por objetivo primário, facilitar a identificação de lacunas de informações taxonômicas e geográficas do INCT - Herbário Virtual da Flora e dos Fungos na rede speciesLink.

Para aqueles que não conhecem o sistema, o Lacunas usa como referência a Flora do Brasil 2020, indicando o status dos dados de cada espécie válida na referida lista. Da Flora do Brasil 2020 são utilizadas as seguintes informações:

  • a classificação hierárquica de cada grupo taxonômico (Algas, Angiospermas, Briófitas, Fungos, Gimnospermas e Pteridófitas)
  • a indicação se a espécie é nativa, naturalizada ou cultivada
  • os nomes aceitos e seus sinônimos
  • os Estados de ocorrência
A cada seis meses é feita uma nova análise, comparando os nomes aceitos e seus sinônimos aos dados disponíveis na rede speciesLink, levando-se em conta os estados de ocorrência, status de georreferenciamento, data da coleta e herbário de origem.

Novos desenvolvimentos foram apresentados ao longo dos anos, como:

  • a integração das informações da Portaria no. 443 com a Lista Nacional Oficial de Espécies da Flora Ameaçadas de Extinção
  • os relatórios de avaliação de risco de extinção do Centro Nacional de Conservação da Flora – CNCFlora através de seus serviços web
  • a introdução de gráficos comparativos dos diferentes relatórios Lacunas a partir de janeiro de 2015 para que usuários possam visualizar a evolução qualitativa dos dados do Herbário Virtual. 

A figura a seguir mostra a evolução do número de espécies de fungos citadas na Flora 2020, sem registros no Herbário Virtual.
Em janeiro de 2015 havia 2.364 espécies de fungos sem registros no Herbário Virtual, 41% do total. Esse valor caiu para 1.948 em janeiro de 2019, 34% do total. Apesar de não mostrar os gráficos na nova interface, o sistema também disponibiliza o relatório de janeiro de 2013, quando o número de espécies de fungos sem registros era 2.850, 50% do total. Assim, o Lacunas é também um indicador da evolução da completude dos dados do Herbário Virtual.

Esse post tem por objetivo comunicar o desenvolvimento de um novo aplicativo em resposta à demanda da comunidade botânica. Para avaliar o status de uma espécie, era necessário passar por todos os níveis hierárquicos. Agora é possível digitar o nome de uma espécie para obter a informação desejada.


À medida que o usuário for digitando, as opções são apresentadas, inclusive os sinônimos.

Esperamos que essa nova ferramenta possa facilitar o uso do sistema Lacunas, tornando-o mais útil para diminuir nossas lacunas de dados e de conhecimento.


12 de mar. de 2019

Balanço da rede speciesLink - 2018

Apesar do ano 2018 ter sido difícil para o desenvolvimento científico, os esforços da parceria com a comunidade científica permitiram ao CRIA cumprir com os seus objetivos estatutários. A rede speciesLink é o principal sistema desenvolvido e mantido pelo CRIA, constituindo a base informacional do INCT – Herbário Virtual da Flora e dos Fungos, com o apoio da Facepe, CNPq e Capes; da rede de polinizadores, com apoio da A.B.E.L.H.A. e CNPq; e da rede SICol, com apoio da Finep.

Graças ao trabalho colaborativo foi possível ampliar a base de informação para 486 conjuntos de dados de 148 instituições do país, 32 do exterior e 4 fototecas que juntos compartilham 9,4 milhões de registros e mais de 2 milhões de imagens de 128 mil espécies.



O gráfico do histórico do fluxo de registros compartilhados online desde outubro de 2002, mostra a evolução contínua da e-infraestrutura de dados, resultante do apoio das agências de fomento e de outros agentes e o impacto da mudança cultural em relação ao benefício do compartilhamento aberto de dados online. Em muitos casos, essa ação tem promovido o reconhecimento institucional quanto a importância das coleções biológicas no ensino, na pesquisa e na formulação e acompanhamento das políticas públicas.

Houve também um expressivo crescimento do número de imagens associadas aos registros textuais de ocorrência de espécies na rede speciesLink. São cerca de 1,8 milhão de registros associados a mais de dois milhões de imagens.


É importante destacar que o compartilhamento de dados resulta em uma maior organização dos acervos das coleções associadas que também são impactadas pela evolução da rede. À medida que os dados são enviados à rede, as coleções têm acesso aos aplicativos que auxiliam na identificação de erros de digitação, no uso de sinonímia e identificação de inconsistências. Os usuários dos dados também contribuem com o seu conhecimento uma vez que dispõem de ferramentas para comunicar possíveis erros aos curadores dos acervos. Assim, o compartilhamento online é também importante ferramenta para melhorar a qualidade dos dados.

Em 2018 foram utilizados cerca de 590 milhões de registros e visualizados cerca de 4 milhões de imagens, ou seja, em média foram utilizados 1,6 milhão de registros e 11 mil imagens por dia.
Dados do Google Analytics indicam que a rede speciesLink foi acessada por 42.225 usuários em 358.303 sessões com duração média de 11 minutos. 91,29% dos acessos são realizados por usuários do Brasil. Os usuários que mais acessaram o sistema foram dos estados de São Paulo, Minas Gerais, Rio de Janeiro, Bahia, Rio Grande do Sul, Paraná, Pernambuco, Distrito Federal, Santa Catarina e Ceará, mas foram contabilizados acessos de todos os estados da união.

A busca no Google Scholar por publicações com citações à rede speciesLink e às ferramentas desenvolvidas e mantidas pelo CRIA, resultou na compilação de uma lista de 455 artigos científicos 9 teses, 6 dissertações e um trabalho de conclusão de curso.

Várias coleções associadas à rede speciesLink autorizaram o compartilhamento de seus dados com o GBIF (Global Biodiversity Information Facility) através do IPT (Internet Publishing Toolkit) mantido pelo CRIA. O GBIF, em seu sistema, atribui a cada download feito por usuários um identificador único (DOI – Digital Object Identifyer) o que permite identificar as publicações científicas que utilizaram os dados da rede e incluíram o DOI como referência. Dessa forma recuperamos mais 76 publicações em 2018 que citam o uso dos dados das coleções brasileiras da rede speciesLink integradas ao GBIF.

Esses números atestam a importância da contínua evolução das coleções biológicas do país, do compartilhamento de dados e da disponibilidade desses dados em um sistema aberto e online para o desenvolvimento científico.