3 de mar. de 2020

Lacunas de conhecimento das abelhas do Brasil

Dora Ann Lange Canhos (CRIA), Eduardo Almeida (USP) e Sidnei de Souza (CRIA)*



Em julho de 2019 foi lançado o sistema Lacunas de conhecimento das abelhas no Brasil, que teve como base o sistema Lacunas de conhecimento da flora e dos fungos do Brasil desenvolvido no escopo do projeto do Instituto Nacional de Ciência e Tecnologia – Herbário Virtual da Flora e dos Fungos. Os sistemas comparam as referências taxonômicas brasileiras, no caso de plantas a Flora do Brasil 2020 e de abelhas o Catálogo de Abelhas Moure, com os dados disponíveis na rede speciesLink. Entre outras informações, essa comparação indica as espécies e os estados sem registros na rede.

Essa ferramenta tem sido muito utilizada pela comunidade botânica na definição de estratégias para novas coletas e para priorizar a digitação de dados nos herbários. A Flora 2020 é um catálogo dinâmico, coordenado pelo Jardim Botânico do Rio de Janeiro, sendo atualizado online por taxonomistas credenciados, enquanto o Catálogo de Abelhas Moure, coordenado pelo Prof. Gabriel Augusto Rodrigues de Melo da UFPR, é um sistema estático, sendo atualizado mediante financiado por projetos. A última atualização do Catálogo de Abelhas Moure foi em 2013, mas está programada uma nova atualização no final de 2020, graças ao apoio do CNPq e da associação A.B.E.L.H.A.

O Catálogo Moure inclui as espécies de abelhas presentes na região neotropical, indicando os países onde ocorre. No desenho do sistema lacunas para abelhas, havia a opção de apenas analisar as espécies com ocorrência no Brasil no Catálogo Moure ou analisar todas as espécies nele incluídas.

Decidimos incluir na análise todas as espécies presentes no Catálogo, independente das informações indicarem sua ocorrência no Brasil. Pretendemos com isso evidenciar as espécies com registros de coletas no Brasil que não têm essa informação no Catálogo Moure e as que, de acordo com ele ocorrem no Brasil, mas não têm registro na rede speciesLink. Trata-se de uma estratégia para buscar acervos que, possivelmente, têm dados sobre as espécies que comprovadamente ocorrem no Brasil e, evidenciar as espécies com dados de ocorrência no Brasil para a avaliação dos responsáveis pela atualização do Catálogo Moure.

As espécies são apresentadas em cores diferentes de acordo com as informações do Catálogo Moure: as que ocorrem no Brasil (verde) e as que não têm evidência de ocorrência no Brasil no Catálogo Moure (marrom).
Vamos usar como exemplo a tribo Emphorini, que no Catálogo Moure possui 91 espécies.
No relatório Lacunas de julho de 2019, fazendo uma busca fonética, incluindo sinônimos, e registros com ou sem coordenadas, o sistema apresenta o seguinte resultado:

Figura 1. Busca fonética por nomes aceitos e seus sinônimos, sem considerar a coordenada geográfica (Lacunas julho 2019)

O sistema classifica as espécies em quatro grupos, de acordo com o número de registros na rede speciesLink: (1) sem registros; (2) com 1 - 5 registros; (3) com 6 – 20 registros; e, (4) com mais de 20 registros. Essa classificação procura indicar o potencial uso dos dados na elaboração de modelos de distribuição geográfica, sendo que o grupo (2) normalmente produz modelos exploratórios, o (3) modelos preliminares e o (4) modelos consistentes, normalmente passíveis de serem utilizados para políticas públicas. É evidente que existem espécies de distribuição restrita que, com poucos dados podem produzir bons modelos.

Na figura 1, as colunas em marrom representam o número de espécies que, de acordo com o Catálogo Moure, não têm indicação de ocorrência do Brasil. O sistema indica

55 espécies sem registros, 3 com 1 a 5 registros, 3 com 6 a 20 registros e 2 com mais de 20 registros de coletas realizadas no Brasil na rede speciesLink.

Podemos concluir que os responsáveis pelo Catálogo Moure poderiam avaliar as 8 espécies com registros de coletas no Brasil na rede speciesLink e validar ou não a sua ocorrência no Brasil nesse catálogo.

Com relação às colunas verdes, indicando as espécies que, de acordo com o Catálogo Moure, ocorrem no Brasil, existem 12 espécies sem registros, 6 com 6 a 20 registros e 10 com mais de 20 registros na rede speciesLink. As 12 espécies sem registros poderiam ser incluídas em estratégias de digitação, inclusão de novos acervos na rede e/ou coletas dessas espécies.

Clicando na espécie Ptilothrix heterochroa que não tem nenhum dado de ocorrência no speciesLink, obtemos a seguinte informação sobre a sua distribuição:


O relatório Lacunas mostra que o Catálogo Moure indica a ocorrência dessa espécie no estado do Rio Grande do Sul enquanto a rede speciesLink não tem nenhum registro dessa espécie. As coleções do Rio Grande do Sul poderiam verificar se essa espécie existe nos seus acervos e priorizar a digitação desses dados para incluí-los na rede speciesLink, ou essa espécie poderia ser incluída em uma lista prioritária de espécies a serem coletadas.

Se clicarmos na espécie Diadasina distincta o sistema mostra ter 59 registros de ocorrência no speciesLink e obtemos a seguinte informação sobre a sua distribuição:


O relatório Lacunas mostra que o Catálogo Moure não indica a ocorrência da espécie no Brasil, mas a rede speciesLink apresenta sua ocorrência em 5 estados. Essa informação pode ser útil para avaliação dos especialistas responsáveis pela atualização do Catálogo Moure sobre a sua distribuição geográfica.


Em janeiro de 2020 foi produzido novo relatório do sistema Lacunas, onde o resultado é comparado com o relatório anterior, talvez tornando a sua interpretação um pouco mais complexa. Continuando com a análise da tribo Emphorini, o relatório agora apresenta como resumo o seguinte gráfico:

Figura 2. Busca fonética por nomes aceitos e seus sinônimos, sem considerar a coordenada geográfica (Lacunas janeiro 2020)

O gráfico compara os dados da rede speciesLink de julho de 2019 com janeiro de 2020. As cores mais claras referem-se às espécies que não têm evidências de ocorrência no Brasil no Catálogo Moure e as mais escuras são as que, de acordo com esse catálogo, ocorrem no Brasil.

Comparando as colunas, em janeiro de 2020 temos dados de ocorrência para 10 espécies sem indicação de ocorrência no Catálogo Moure, lembrando que em julho de 2019 eram 8. Temos também 11 espécies do grupo que  ocorrem no Brasil de acordo com o Catálogo Moure, mas não têm registros na rede speciesLink. Esse número em julho de 2019 era 12. Comparando os dois relatórios, três espécies passaram a ter dados na rede speciesLink: Diadasia willineri (Moure, 1947), Ptilothrix heterochroa Cockerell, 1919, Ptilothrix scalaris (Holmberg, 1903). Escolhendo como exemplo a espécie Ptilothrix scalaris, a rede speciesLink em janeiro de 2020 registrou 5 registros, 3 de coletas realizadas na Fazenda Porto Conceição e 2 na Fazenda Pirizal, ambas em Porto Murtinho, Mato Grosso do Sul. As amostras são mantidas na Coleção de Hymenoptera do Museu de Biodiversidade da Universidade Federal da Grande Dourados, Dourados, Mato Grosso do Sul, que atualizou seus dados em agosto de 2019.

Quanto à ocorrência de Ptilothrix heterochroa, são dois indivíduos coletados na Fazenda São Maximiano em Guaíba, RS, que estão sendo mantidos na coleção de abelhas MCP-Abelhas da Pontifícia Universidade Católica do Rio Grande do Sul. Os dados da Coleção de Abelhas MCP-Abelhas foram atualizados em novembro de 2019. O Catálogo Moure indica a ocorrência nesse estado.

Resumindo, o relatório Lacunas mostra a evolução da completude dos dados da rede speciesLink vis-a-vis o Catálogo Moure. Esperamos que esse sistema também possa contribuir para a expansão da informatização e disponibilização de dados da ocorrência das abelhas no Brasil.

* Nota: os autores agradecem o apoio do CNPq e da Associação Brasileira de Estudos das Abelhas (A.B.E.L.H.A.) ao projeto "Consolidação da e-infraestrutura de dados abertos sobre a diversidade das abelhas nativas do Brasil", Processo 400580/2018-7

28 de jan. de 2020

speciesLink 2019


O ano de 2019 foi importantíssimo para a rede speciesLink. Destacamos a transferência dos sistemas públicos de informação do CRIA do Internet Data Center em Brasília para o Centro de Dados Compartilhados em Recife, ambas infraestruturas da Rede Nacional de Ensino e Pesquisa (RNP). Essa ação contou com o apoio do Ministério da Ciência, Tecnologia, Inovações e Comunicações (MCTIC) e com a parceria fundamental da RNP. Também contou com a cooperação das equipes das coleções biológicas parceiras da rede que compreenderam o momento delicado da equipe do CRIA na manutenção de um sistema tão importante em uma infraestrutura obsoleta e, além de explicitarem o seu apoio junto ao MCTIC, continuaram trabalhando na digitação, atualização e melhora da qualidade dos seus dados online.

Iniciamos 2019 com 483 conjuntos de dados integrados à rede e fechamos o ano com 505, um aumento de 4,6%. Os acervos são mantidos por:
Fonte: Network

  • Universidades brasileiras: 46 federais (56 campi), 21 estaduais (30 campi), 17 particulares e 1 municipal, além de 3 Institutos Federais de Educação e C&T
  • Institutos de Pesquisa brasileiros: 5 federais (8 estados), 19 estaduais e 1 municipal
  • Empresas: 3 públicas (7 estados) e 1 privada
  • Organizações não governamentais no Brasil: 3
  • Pessoas físicas no Brasil: 4 (fototecas)
  • Instituições do Exterior: 30
  • Outras instituições do Brasil: 2
(Fonte: Dashboard)

Assim, quando falamos da evolução do número de dados e informações online, nos referimos ao trabalho em rede, envolvendo equipes de 156 instituições no compartilhamento aberto de dados, do CRIA e da RNP no desenvolvimento e manutenção dos sistemas e das infraestruturas computacional e de comunicação e das instituições de fomento (MCTIC, CNPq, FINEP, FACEPE e A.B.E.L.H.A.).


Evolução da rede speciesLink em números


Fonte: Indicadores

O CRIA registra a evolução do número de registros online desde outubro de 2002, quando foi lançada, ainda de forma experimental, com dados do herbário da Unicamp (UEC). A rede promoveu uma mudança cultural no compartilhamento aberto de dados via Internet, e hoje é compreendida como um importante elemento de divulgação e valorização do trabalho de coleções biológicas.



A rede ainda é dependente do apoio de projetos, tanto para a manutenção e desenvolvimento da infraestrutura, como também para a digitação dos dados e digitalização das imagens. Em 2019 foram acrescidos cerca de 800 mil novos registros e 760 mil imagens. O uso médio foi 1,9 milhão de registros e 11 mil imagens por dia (fonte: Estatísticas do Uso dos Dados).

Mais de 90% dos registros têm uma amostra (voucher) associada ao dado, o que é considerado um dado de mais qualidade uma vez que pode ser reavaliado sempre que necessário. Cerca de 69% dos dados são de coleções de algas, fungos e plantas, 28% de animais, 0,3% de microrganismos e 0,07% de fósseis. Os demais dados são de coleções abrangentes.

São mais de 10 milhões de registros online que, sem dúvida alguma representa um enorme avanço. No entanto, somente considerando as coleções que participam da rede, tem-se ainda mais de 16 milhões de registro a serem digitados e integrados. Isso sem contar das coleções que ainda não participam da rede.

Devemos também destacar a parceria com instituições do exterior que hoje compartilham cerca de 1,7 milhões de registros com a rede speciesLink. Cerca de 74% são dados de algas, fungos e plantas, no contexto do INCT - Herbário Virtual das Plantas e Fungos. 23% são de animais, a maioria  abelhas, graças ao apoio da associação A.B.E.L.H.A. e do CNPq, e peixes, graças à integração voluntária dos dados da Academia de Ciências Naturais da Filadélfia.

Para concluir, novamente gostaríamos de destacar a importância da formação de redes colaborativas que compartilham seus dados e seu conhecimento de forma livre e aberta, acessível a todos os interessados. Esperamos, dessa forma, contribuir para o estabelecimento de políticas e sistemas educativos baseados em evidências científicas.


29 de ago. de 2019

Status dos nomes científicos na rede speciesLink


A rede speciesLink, desde o seu início, tem uma preocupação muito grande com a qualidade dos dados que publica. Entende que compete aos curadores corrigirem eventuais erros ou inconsistências dos dados de seus acervos, mas cabe ao CRIA desenvolver ferramentas para auxiliar os curadores na detecção desses erros e inconsistências, e para atestar a qualidade dos dados para os usuários.

Uma ferramenta desenvolvida nos últimos anos compara os nomes científicos de cada registro, com os nomes em listas de referência ou dicionários. O nome científico de cada registro recebe uma etiqueta (tag), indicando tratar-se de um nome aceito, sinônimo, ambíguo ou não encontrado. Um nome é considerado ambíguo quando, em um mesmo dicionário, ele possui mais de um status.

Até o dia 22 de agosto de 2019, essa checagem do nome era feita sempre que os dados de um acervo eram atualizados. Assim, se houvesse uma alteração no status do nome nos dicionários, a rede speciesLink poderia indicar diferentes status para esse nome – aceito, sinônimo, ambíguo ou não encontrado – dependendo da data de atualização dos dados nas diferentes coleções.

Recentemente, foi solicitado ao CRIA a inclusão de mais duas referências: AlgaeBase e MycoBank. Além da inclusão dessas referências, alteramos o procedimento de atualização do status dos nomes. O procedimento passa a ser a atualização do status de todos os registros da rede speciesLink sempre que algum dicionário for atualizado.


Os dados do AlgaeBase e parte do MycoBank foram integrados ao sistema e o status dos nomes de cada registro da rede speciesLink foi atualizado.


A ordem do uso das referências é importante. Se o nome de uma espécie for encontrado na primeira referência, ele não será checado nas demais. Portanto, o nome de um registro terá o status determinado pela primeira referência em que for encontrado.

As referências e a ordem utilizada para os diferentes grupos são:
  • Para fungos (registro com o campo Reino = Fungi): MycoBank, Catálogo da Vida e Flora do Brasil 2020;
  • Para plantas e algas (registro com campo Reino = Plantae ou coleção associada ao INCT-Herbário Virtual da Flora e dos Fungos): AlgaeBase, MycoBank, Flora do Brasil 2020 e o Catálogo da Vida;
  • Para animais (registro com campo Reino = Animalia ou coleção associada ao grupo Animais): Catálogo de Abelhas Moure e o Catálogo da Vida;
  • Para microrganismos (coleções associadas à rede SIColNet): o dicionário Prokaryotic Nomenclature Up-to-date da DSMZ e o Catálogo da Vida;
  • Para outros casos: o Catálogo da Vida.

A tabela a seguir apresenta uma síntese dos resultados, comparando o status no dia 22 de agosto de 2019 com o dia 26 de agosto de 2019, quando essas novas referências foram integradas ao sistema e todos os nomes de espécies do banco de dados da rede speciesLink reavaliados.


Tem-se dois efeitos na evolução desses números: a inclusão das novas referências (AlgaeBase e MycoBank) e a atualização do status de todos os registros na rede speciesLink. As novas referências promoveram um aumento do número de registros tanto de espécies com nomes aceitos, quanto de seus sinônimos. Considerando todos os 9,7 milhões de registros, houve um aumento de 3% no número de registros com nomes aceitos e de 9% dos sinônimos.

A tabela a seguir mostra o número de nomes utilizados de cada referência para indicar o status dos nomes dos registros da rede speciesLink.

Referências (em ordem alfabética):



15 de jul. de 2019

Lacunas de conhecimento das abelhas no Brasil

Divulgamos o lançamento de uma nova ferramenta para avaliar as lacunas de dados e conhecimento das abelhas neotropicais que ocorrem no Brasil. O desenvolvimento desse sistema é um produto do projeto "Consolidação da e-infraestrutura de dados abertos sobre a diversidade das abelhas nativas do Brasil" (Processo: 400580/2018-7), financiado pelo CNPq e pela associação A.B.E.L.H.A. e coordenado pelo Prof. Eduardo Andrade Botelho de Almeida da USP, Ribeirão Preto.

São utilizadas como fontes de dados a rede speciesLink e o Catálogo de Abelhas Moure. Esse sistema utiliza como referência o sistema Lacunas de Conhecimento da Flora e dos Fungos do Brasil, lançado em setembro de 2012 no contexto do Instituto Nacional da Flora e dos Fungos (INCT) com o apoio do CNPq.

O objetivo é apresentar o status dos dados online para todas as espécies válidas do Catálogo Moure, inclusive listando aquelas que não possuem registros na rede speciesLink. O sistema segue a hierarquia taxonômica apresentada no Catálogo Moure e também permite a busca pelo nome de uma espécie.


Ao selecionar uma subfamília, por exemplo Apinae, o sistema apresenta um gráfico com quatro colunas: (1) com o número de espécies que não têm registros na rede speciesLink (2) com as que têm entre 1 a 5 registros; (3) com 6 a 20 registros; e, (4) com mais de 20 registros, sempre de acordo com o critério de busca adotado.


Esse agrupamento de acordo com o número de registros disponíveis na rede speciesLink, procura indicar o potencial do uso dos dados na elaboração de modelos de distribuição geográfica exploratórios (até 5 pontos distintos de ocorrência), preliminares (entre 6 a 20 pontos) ou consistentes (com mais de 20 pontos).

A cor castanha indica o número de espécies do Catálogo Moure para as quais não há citação de ocorrência no Brasil e, a cor verde, as que o Catálogo cita a ocorrência no Brasil.

Quanto aos critérios de busca, o usuário pode optar por só usar os nomes aceitos ou os aceitos e seus sinônimos, a busca exata ou fonética, e pode-se considerar todos os registros com ou sem coordenadas geográficas ou selecionar apenas os registros com coordenadas consistentes e distintas. A inclusão das coordenadas normalmente reduz o número de espécies com registros que atende esse critério.


Ainda no nível de subfamílias é possível identificar as lacunas geográficas por estado de ocorrência. Nesse caso, só estão sendo consideradas as espécies, cujas ocorrências nos estados brasileiros são citadas no Catálogo Moure.


O sistema mostra o número de espécies da subfamília Apinae reportadas no Catálogo Moure como ocorrendo nos estados indicados, mas que não apresentam registros na rede speciesLink. Clicando no estado de Sergipe, por exemplo, o sistema apresenta uma lista dessas espécies:


A mesma análise é feita para cada tribo e gênero, só que a partir da tribo a lista das espécies é apresentada. Selecionando a tribo Bombini e adotando o critério de busca mais abrangente (incluir sinônimos, busca fonética, com ou sem coordenadas geográficas), obtém-se um resultado muito interessante que pode tanto contribuir para a inclusão de informações sobre a ocorrência geográfica no Catálogo Moure, como também pode orientar novas coletas. O sistema mostra a espécie Bombus pullatus com 303 registros, sendo que o Catálogo Moure não cita sua ocorrência no Brasil. O sistema mostra mapas comparativos dos estados de ocorrência da espécie no Catálogo Moure e na rede speciesLink.


Mostra também o número de registros por ano de coleta, o que pode indicar lacunas temporais.


Só para mostrar outro exemplo onde um sistema pode se beneficiar da informação do outro, para a espécie Bombus transversalis (Olivier, 1789), tem-se a seguinte informação de distribuição no Lacunas:


Nesse caso a rede speciesLink indica a ocorrência nos estados de Roraima, Goiás e Paraná, não indicadas no Catálogo Moure; por outro lado o Catálogo indica a ocorrência no estado de Mato Grosso, para o qual a rede speciesLink não tem dados. Cabe aos especialistas avaliarem se os dados dos registros do speciesLink estão corretos.

Para Algas, Fungos e Plantas, o sistema Lacunas têm auxiliado a comunidade botânica na definição de estratégias de coleta, de digitação e de integração de dados de novos acervos à rede speciesLink.

Toda crítica ou sugestão é bem-vinda.

Lacunas de conhecimento das abelhas no Brasil: http://moure.cria.org.br/lacunas

3 de jul. de 2019

INCT – Herbário Virtual da Flora e dos Fungos: Imagens


Enquanto a equipe do CRIA, nos últimos meses focava o seu trabalho na transferência dos sistemas hospedados no Internet Data Center (IDC/RNP) para o Centro de Dados Compartilhados da Rede Nacional de Ensino e Pesquisa (CDC/RNP) em Recife, os herbários parceiros da rede speciesLink trabalhavam na digitação e correção dos dados e na digitalização de seus espécimes. Esse post procura mostrar o processo e a evolução do número de imagens compartilhadas, com destaque ao primeiro semestre do ano de 2019.

Imagens agregam um enorme valor às coleções biológicas. O apoio ao desenvolvimento do serviço de imagens do INCT-Herbário Virtual foi aprovado pelo CNPq em dezembro de 2010, e o serviço foi lançado em maio de 2011 com 9,2 mil imagens. 

Cada herbário tem sua metodologia e equipamentos para a produção de imagens. O diagrama a seguir mostra o processo de recebimento e integração das imagens à rede speciesLink.


Além do trabalho de digitalização e documentação de cada espécime, há o trabalho de envio, conversão de formato, verificação visual e ajustes, controle de imagens repetidas e atualização do banco de imagens e do banco de dados. 

As imagens de espécimes de algas, fungos e plantas representam 99,6% das imagens da rede speciesLink. Outros grupos que compartilham imagens são abelhas, peixes e microrganismos. Esses grupos se beneficiaram do desenvolvimento realizado no contexto do INCT-Herbário Virtual da Flora e dos Fungos, com o apoio do CNPq. 

O gráfico a seguir mostra a evolução do número de imagens enviadas ao CRIA. 



O INCT-Herbário Virtual fechou o ano de 2018 compartilhando cerca de 2,2 milhões de imagens, sendo 1,8 milhão de imagens de vouchers, 45 mil de material vivo, 3 mil de pólen e 300 mil de etiquetas. Hoje, dia 3 de julho de 2019, o INCT-Herbário Virtual compartilha mais de 2,55 milhões de imagens, sendo cerca de 2,2 milhões de imagens de vouchers, 47 mil de material vivo e 3 mil de pólen e 300 mil de etiquetas. De 1.875.621 registros com imagens no final de 2018, o INCT-Herbário Virtual passa a servir 2.130.048 registros com imagens.

Ao todo, 77 conjuntos de dados compartilham imagens associadas aos dados textuais, sendo que 6 iniciaram o envio de imagens esse ano. Ao todo 40 conjuntos de dados enviaram novas imagens em 2019. O grande destaque do semestre foi o Museu Botânico Municipal de Curitiba, que nesse período enviou mais de 368 mil imagens. São pouco mais de 257 mil registros com imagens, sendo 1.865 de typus.

O compartilhamento das imagens associadas aos dados textuais das amostras coletadas permite a validação da determinação por terceiros e representa uma importante ferramenta para pesquisa e ensino. 

Esse ano já foram utilizados cerca de 285 milhões de registros via interface de busca e mais de 1,7 milhão de imagens. Esses números representam um uso diário de mais de 1,5 milhão de registros e 9,4 mil imagens

Parabéns a todos os herbários e aos usuários da rede speciesLink, que, além de suas pesquisas e serviços, contribuem para o aprimoramento dos dados e dos sistemas, identificando material, corrigindo erros e enviando novas demandas.








30 de mai. de 2019

speciesLink no CDC da RNP

No final de 2018, com a celebração do 20º. termo aditivo ao Contrato de Gestão entre o MCTIC e a RNP, foi dado um importante passo para assegurar a permanência da e-infraestrutura speciesLink. Esse termo aditivo assegura o apoio da RNP na migração dos sistemas que compõem a rede speciesLink para a infraestrutura em nuvem no Centro de Dados Compartilhados em Recife. Em abril concluímos a transferência de todos os sistemas públicos de informação, dados, ferramentas e aplicativos desenvolvidos e mantidos pelo CRIA para esse Centro. Portanto, os sistemas agora estão em um ambiente seguro com hardware compatível com as suas necessidades.

Gostaríamos de deixar os nossos agradecimentos por todo apoio recebido e pela compreensão daqueles que precisaram do nosso suporte técnico nos últimos seis meses. Essa transferência demandou muito trabalho de uma equipe que é muito reduzida, o que em determinados momentos aumentou o nosso tempo de resposta às demandas dos nossos parceiros.

Como marco do início dessa nova etapa, preparamos um documento síntese sobre a rede speciesLink, uma rede de informação colaborativa sobre a biodiversidade brasileira que disponibilizamos para que os interessados possam ter uma visão mais ampla sobre essa importante e-infraestrutura de acesso livre e aberto a todos.

Novamente muito obrigada por toda colaboração!

equipe do CRIA

27 de mai. de 2019

Novidades no sistema Lacunas

O sistema Lacunas de conhecimento da flora e dos fungos do Brasil, lançado em 2012, tem por objetivo primário, facilitar a identificação de lacunas de informações taxonômicas e geográficas do INCT - Herbário Virtual da Flora e dos Fungos na rede speciesLink.

Para aqueles que não conhecem o sistema, o Lacunas usa como referência a Flora do Brasil 2020, indicando o status dos dados de cada espécie válida na referida lista. Da Flora do Brasil 2020 são utilizadas as seguintes informações:

  • a classificação hierárquica de cada grupo taxonômico (Algas, Angiospermas, Briófitas, Fungos, Gimnospermas e Pteridófitas)
  • a indicação se a espécie é nativa, naturalizada ou cultivada
  • os nomes aceitos e seus sinônimos
  • os Estados de ocorrência
A cada seis meses é feita uma nova análise, comparando os nomes aceitos e seus sinônimos aos dados disponíveis na rede speciesLink, levando-se em conta os estados de ocorrência, status de georreferenciamento, data da coleta e herbário de origem.

Novos desenvolvimentos foram apresentados ao longo dos anos, como:

  • a integração das informações da Portaria no. 443 com a Lista Nacional Oficial de Espécies da Flora Ameaçadas de Extinção
  • os relatórios de avaliação de risco de extinção do Centro Nacional de Conservação da Flora – CNCFlora através de seus serviços web
  • a introdução de gráficos comparativos dos diferentes relatórios Lacunas a partir de janeiro de 2015 para que usuários possam visualizar a evolução qualitativa dos dados do Herbário Virtual. 

A figura a seguir mostra a evolução do número de espécies de fungos citadas na Flora 2020, sem registros no Herbário Virtual.
Em janeiro de 2015 havia 2.364 espécies de fungos sem registros no Herbário Virtual, 41% do total. Esse valor caiu para 1.948 em janeiro de 2019, 34% do total. Apesar de não mostrar os gráficos na nova interface, o sistema também disponibiliza o relatório de janeiro de 2013, quando o número de espécies de fungos sem registros era 2.850, 50% do total. Assim, o Lacunas é também um indicador da evolução da completude dos dados do Herbário Virtual.

Esse post tem por objetivo comunicar o desenvolvimento de um novo aplicativo em resposta à demanda da comunidade botânica. Para avaliar o status de uma espécie, era necessário passar por todos os níveis hierárquicos. Agora é possível digitar o nome de uma espécie para obter a informação desejada.


À medida que o usuário for digitando, as opções são apresentadas, inclusive os sinônimos.

Esperamos que essa nova ferramenta possa facilitar o uso do sistema Lacunas, tornando-o mais útil para diminuir nossas lacunas de dados e de conhecimento.


12 de mar. de 2019

Balanço da rede speciesLink - 2018

Apesar do ano 2018 ter sido difícil para o desenvolvimento científico, os esforços da parceria com a comunidade científica permitiram ao CRIA cumprir com os seus objetivos estatutários. A rede speciesLink é o principal sistema desenvolvido e mantido pelo CRIA, constituindo a base informacional do INCT – Herbário Virtual da Flora e dos Fungos, com o apoio da Facepe, CNPq e Capes; da rede de polinizadores, com apoio da A.B.E.L.H.A. e CNPq; e da rede SICol, com apoio da Finep.

Graças ao trabalho colaborativo foi possível ampliar a base de informação para 486 conjuntos de dados de 148 instituições do país, 32 do exterior e 4 fototecas que juntos compartilham 9,4 milhões de registros e mais de 2 milhões de imagens de 128 mil espécies.



O gráfico do histórico do fluxo de registros compartilhados online desde outubro de 2002, mostra a evolução contínua da e-infraestrutura de dados, resultante do apoio das agências de fomento e de outros agentes e o impacto da mudança cultural em relação ao benefício do compartilhamento aberto de dados online. Em muitos casos, essa ação tem promovido o reconhecimento institucional quanto a importância das coleções biológicas no ensino, na pesquisa e na formulação e acompanhamento das políticas públicas.

Houve também um expressivo crescimento do número de imagens associadas aos registros textuais de ocorrência de espécies na rede speciesLink. São cerca de 1,8 milhão de registros associados a mais de dois milhões de imagens.


É importante destacar que o compartilhamento de dados resulta em uma maior organização dos acervos das coleções associadas que também são impactadas pela evolução da rede. À medida que os dados são enviados à rede, as coleções têm acesso aos aplicativos que auxiliam na identificação de erros de digitação, no uso de sinonímia e identificação de inconsistências. Os usuários dos dados também contribuem com o seu conhecimento uma vez que dispõem de ferramentas para comunicar possíveis erros aos curadores dos acervos. Assim, o compartilhamento online é também importante ferramenta para melhorar a qualidade dos dados.

Em 2018 foram utilizados cerca de 590 milhões de registros e visualizados cerca de 4 milhões de imagens, ou seja, em média foram utilizados 1,6 milhão de registros e 11 mil imagens por dia.
Dados do Google Analytics indicam que a rede speciesLink foi acessada por 42.225 usuários em 358.303 sessões com duração média de 11 minutos. 91,29% dos acessos são realizados por usuários do Brasil. Os usuários que mais acessaram o sistema foram dos estados de São Paulo, Minas Gerais, Rio de Janeiro, Bahia, Rio Grande do Sul, Paraná, Pernambuco, Distrito Federal, Santa Catarina e Ceará, mas foram contabilizados acessos de todos os estados da união.

A busca no Google Scholar por publicações com citações à rede speciesLink e às ferramentas desenvolvidas e mantidas pelo CRIA, resultou na compilação de uma lista de 455 artigos científicos 9 teses, 6 dissertações e um trabalho de conclusão de curso.

Várias coleções associadas à rede speciesLink autorizaram o compartilhamento de seus dados com o GBIF (Global Biodiversity Information Facility) através do IPT (Internet Publishing Toolkit) mantido pelo CRIA. O GBIF, em seu sistema, atribui a cada download feito por usuários um identificador único (DOI – Digital Object Identifyer) o que permite identificar as publicações científicas que utilizaram os dados da rede e incluíram o DOI como referência. Dessa forma recuperamos mais 76 publicações em 2018 que citam o uso dos dados das coleções brasileiras da rede speciesLink integradas ao GBIF.

Esses números atestam a importância da contínua evolução das coleções biológicas do país, do compartilhamento de dados e da disponibilidade desses dados em um sistema aberto e online para o desenvolvimento científico.



20 de dez. de 2018

Nota de divulgação PDJ – INCT – André Luiz Gaglioti


A bolsa de Pós-Doutorado Junior (PDJ) - CAPES concedida pelo Instituto Nacional de Ciência e Tecnologia Herbário Virtual da Flora e dos Fungos (INCT – Herbário Virtual) foi fundamental para o avanço nas pesquisas do grupo Urticineae, com foco principal na família das urtigas (Urticaceae). O projeto permitiu a qualificação de aproximadamente 11.500 metadados de Urticaceae do INCT – Herbário Virtual, que vem sendo enviados e compartilhados diretamente com os curadores dos herbários participantes da rede de herbários do INCT. Além disso, foram associadas aos metadados cerca de 500 imagens na plataforma da Flora do Brasil 2020. Durante esse trabalho, foram revisados 4.918 binômios de Urticaceae para o mundo, dos quais 855 foram considerados espécies aceitas para a região Neotropical. Foram publicados seis artigos científicos no período, onde constam parte da pesquisa realizada junto ao INCT, durante o desenvolvimento da bolsa PDJ. Cabe ressaltar ainda, as publicações das monografias de sete gêneros de Urticaceae (Boehmeria, Coussapoa, Phenax, Pourouma, Pouzolzia, Urera e Urtica) na Flora do Brasil 2020 online, participações nos Congressos Nacional e Latinoamericano de Botânica e a formação de recursos humanos por meio da orientação e coorientação de mestrados. Os resultados obtidos através da bolsa PDJ/CAPES/INCT, demonstram a importância da qualificação dos dados junto ao INCT – Herbário Virtual para a credibilidade e eficácia dos estudos realizados através deste instrumento.




28 de nov. de 2018

O impacto da digitação e disponibilização dos dados de coleções biológicas

Os impactos ambientais aumentam a demanda e urgência pela disponibilidade de dados de qualidade sobre a ocorrência de espécies no planeta. Nas últimas duas décadas, graças aos avanços das tecnologias digitais houve um aumento exponencial na digitação, integração e disponibilização de dados online para uso em pesquisa, conservação e em outros domínios da ciência sobre biodiversidade. Coleções biológicas em universidades, institutos de pesquisa e museus são essenciais para o desenvolvimento da fronteira do conhecimento em sistemática, ecologia e conservação.

O artigo “The history and impact of digitization and digital data mobilization on biodiversity research, G Nelson, S Ellis - Phil. Trans. R. Soc. B, 2019” resgata a história da digitação dos dados de coleções a partir de 1999, com a recomendação da criação do GBIF (Global Biodiversity Information Facility) pelo fórum da megaciência da OCDE (Organização para a Cooperação e Desenvolvimento Econômico). O esforço do CRIA e seus parceiros no desenvolvimento da rede speciesLink é citado entre outros exemplos internacionais. O artigo também destaca diferentes pesquisas que se tornaram possíveis graças a disponibilidade dos dados e ao desenvolvimento de novas ferramentas. Vale a pena conferir!