13 de set de 2018

Setembro Verde 2018

Reproduzimos a seguir a nota enviada pelo Comitê Gestor do Instituto Nacional de Ciência e Tecnologia - Herbário Virtual da Flora e dos Fungos aos curadores dos herbários participantes.

Caros Curadores,

Anualmente, no mês de setembro ocorre a Semana da Primavera dos Museus, e no mês de outubro a Semana Nacional de Ciência e Tecnologia, quando diferentes instituições promovem atividades para integração das suas equipes e dessas com a comunidade. Pensamos que esta seria uma excelente oportunidade para que os herbários da Rede INCT-HVFF, juntos, promovessem atividades que dessem visibilidade à rede e ao mesmo tempo trouxesse benefícios para todos. Assim, sugerimos que em setembro e outubro os herbários promovam ações integradas que visem aprimorar e qualificar o seu banco de dados e, consequentemente, os dados de cada coleção disponibilizados pelo INCT-HVFF. Como estas atividades também visam integrar as equipes, elas podem ter diferentes denominações como oficinas, mutirões, saraus (se permitido colocar música de fundo), recital de poesia (a cada intervalo de 2 horas de trabalho uma poesia declamada ou encenada), ou outros formatos que possam ser comportados no espaço de trabalho onde serão realizadas.

Estamos denominando esta ação de “Setembro Verde 2018”.

As atividades podem envolver a identificação de materiais indeterminados com o auxílio de especialistas da casa ou de instituições próximas, ou mesmo de aposentados, que possam dispor de algum tempo trabalhando com alunos e bolsistas, auxiliando na melhoria da qualidade do acervo.
A separação de duplicatas para envio a especialistas que tenham sido contatados previamente, também poderia ocorrer no contexto das atividades programadas para estas semanas.
Outra iniciativa que pode ser desenvolvida por cada herbário é a correção de nomes de espécies redigidos de forma errada; padronização dos nomes de autores de espécies que muitas vezes não seguem as abreviaturas convencionadas mais recentemente; ou a conversão de coordenadas geográficas consideradas suspeitas por estarem em um sistema diferente do assumido para o banco de dados.

O Anexo apresentado a seguir é um texto preparado pela equipe do CRIA indicando os problemas mais comuns que afetam a recuperação e análise dos dados online. Esperamos que esse texto possa contribuir para o sucesso dessa ação integrada, visando a melhora da qualidade dos dados e fortalecimento das nossas instituições. A equipe do CRIA estará disponível para esclarecer dúvidas e orientar as ações.

Esperamos que esta iniciativa tenha o apoio de todos os herbários participantes da Rede INCT-HVFF, e que, dessa forma, possamos avançar na construção de uma rede mais sólida e útil para todos.

Um abraço a todos,

Comitê Gestor
INCT – Herbário Virtual da Flora e dos Fungos



Anexo

Marco Zero

Dados online do INCT - Herbário Virtual da Flora e dos Fungos
03/09/2018
Número de registros
6.173.278
Número de registros com identificação em branco
299.101
Número de registros só com nome de família
227.475
Número de registros só com nome de gênero
744.713
Número de registros com nomes não encontrados
311.379
Número de registros com nomes sinônimos
639.136
Registros georreferenciados
4.959.265
Coordenadas geográficas suspeitas
585.593
Número de materiais-tipos
137.415
Número de espécies indicadas como nativas na Flora do Brasil 2020 que não têm registros indicados no Herbário Virtual on-line (speciesLink)
11/07/2018
Algas
2.098
Angiospermas
1.434
Briófitas
171
Gimnospermas
0
Samambaias e Licófitas
91
Fungos
1.985

Campanha para aumentar a qualidade dos dados dos herbários na rede speciesLink[1]

Esse texto procura recomendar algumas ações que os herbários podem desenvolver para melhorar a qualidade dos dados online do Herbário Virtual da Flora e dos Fungos na rede speciesLink. O Herbário Virtual hoje (3 de setembro de 2018) possui 201 conjuntos de dados que compartilham 6.173.278 registros, sendo 4.959.265 georreferenciados. Possui 1.640.972 registros associados com 2.030.551 imagens, 137.415 registros de typus e 72.218 registros de espécies ameaçadas de extinção. São 85.022 espécies aceitas distintas, usando como referência a Flora do Brasil 2020 e o Catálogo da Vida do species2000.



Preenchimento dos campos

Importante - não incluir comentários ou observações nos campos específicos e adotar padrões aceitos. Pontos de interrogação, comentários como “não sei” ou até dúvidas em relação a municípios ou estados devem constar apenas em um campo de observação. Nomes dos locais devem ser escritos por completo ou usando a sigla (Ex: São Paulo ou a sigla SP).

Um campo comumente problemático é “typus”. O padrão é Isótipo, Parátipo, Holótipo, etc.; ou Isotype, Paratype, Holotype; ou ainda, Isotypus, Paratypus, Holotypus. É muito comum encontrar esse campo com vários comentários o que faz com que um espécime cujo campo typus foi preenchido com “não” seja classificado como espécime tipo pelos indicadores.

Outra recomendação é preencher todos os campos. Muitas coleções que só têm plantas não preenchem o campo reino ou, mesmo que tenham também fungos e/ou algas, não mencionam o reino, o que é necessário. Noutros casos, quando o acervo tem coletas realizadas apenas no Brasil, o campo “país” da coleta não é preenchido. Os dados de muitas coletas podem deixar de ser recuperados se o usuário utilizar esses campos como critérios de busca.

A interface de busca da rede speciesLink (inct.splink.org.br) permite a busca por campos em branco (digitar embranco no campo indicado) e campos com dados (digitar naobranco). Trata-se de uma ferramenta importante para encontrar material não identificado ou para avaliar a qualidade geral dos dados para determinado campo. 

Seguem alguns exemplos.

Dados Taxonômicos


Objetivo: 
  • preencher o campo Reino
  • fomentar a identificação online de espécimes com imagens; 
  • fomentar a visita de especialistas em herbários com material não identificado; 
  • melhorar a qualidade dos dados preenchendo o campo determinador; e,
  • preencher o campo tipo corretamente – sem utilizar o campo para comentários.


A análise a seguir é feita com todos os conjuntos de dados que compõem o HerbárioVirtual online. Se um herbário quiser fazer essas análises somente com os seus dados é só incluir o código de sua coleção no campo cód. coleção no formulário de busca.

Oportunidade para taxonomistas!

          

1. Busca por família=embranco e nome científico = embranco, com imagem


A busca por espécimes não identificados, mas que possuem imagens pode permitir a identificação online do material por especialistas. O Herbário Virtual possui 1.296 registros que atendem esse critério de busca, 120 registros sem reino, 83 registros de Fungi e 1.093 de Plantae.


2. Busca por família=naobranco e Nome científico=embranco, com imagem do voucher


Nesse caso também pode ser possível a identificação online do material. O Herbário Virtual hoje tem 38.074 registros de 296 famílias (nomes aceitos) que atendem esse critério de busca.


3. Busca por família=naobranco, nome científico=embranco, sem imagem


Resultado: 189.289 registros de 615 famílias (nomes aceitos). A identificação desse material teria que ser in loco.


4. Busca por família=naobranco, nome científico=naobranco embranco (significa só com o gênero preenchido), com imagens


Resultado de registros com imagens: 165.745 espécimes de 500 famílias (nomes aceitos) e 3.107 gêneros (nomes aceitos) que possivelmente poderiam ser identificados pelas imagens.


5. Busca por família=naobranco, nome científico=naobranco embranco (significa só com o gênero preenchido), sem imagens


Resultado de registros sem imagens: 568.649 espécimes de 920 famílias (nomes aceitos) e 6.023 gêneros (nomes aceitos) que possivelmente poderia despertar o interesse de alguns especialistas em visitar o herbário com maior demanda.

Campos em branco – ação para os curadores e técnicos


6. Busca por número de catálogo=embranco


O identificador único de um registro é a composição do acrônimo da coleção e o número de catálogo. No Herbário Virtual há 238.395 registros com o número de catálogo em branco. Esses registros não podem ser referência em uma publicação científica.


7. Busca pelo campo Reino = embranco


Todo registro deve ter o campo reino preenchido: Plantae ou Fungi. O Herbário Virtual apresenta 131.733 registros (2,13% dos dados online) sem esta informação. Uma busca por Reino=embranco e família=naobranco retorna 126.247. Sem essa informação é impossível saber o número de registros de Plantas e de Fungos.


8. Busca por Determinador em branco


O nome do especialista que identifica o material é um fator de qualidade. É importante, por exemplo, na análise de duplicatas com determinações diferentes. No Herbário Virtual o campo Determinador = embranco apresenta 2.362.313 registros, número muito elevado.


9. Tipo


Quando o usuário filtra uma busca por espécimes tipo, o sistema apresenta os registros que têm o campo tipo preenchido. É comum encontrar o campo preenchido com vírgulas, pontos, ponto de interrogação, ou com comentários como não ou not a type, entre outros. Seria fundamental corrigir essas distorções, deixando o campo em branco se o material não é tipo.


10. Dados da coleta


Avaliação dos dados online do Herbário Virtual:
  • Campo país=embranco: 65.544 registros (em mais de 3 mil consta o Estado);
  • Campo estado=embranco: 531.744 registros;
  • Campo município=embranco: 1.376.269 registros

Os próximos 3 campos são fundamentais para identificar duplicatas:
  • Campo coletor=embranco: 178.210 registros
  • Campo número de coleta=embranco: 607.217 registros
  • Ano da coleta=embranco: 790.611








[1] Os dados apresentados são do dia 03 de setembro de 2018

13 de jun de 2018

Indicador CITATIONS do GBIF - Global Biodiversity Information Facility

O CRIA, através da sua rede speciesLink, compartilha com outras redes os dados de 166 coleções e sub-coleções biológicas do Brasil, com destaque para os herbários associados ao INCT-Herbário Virtual da Flora e dos Fungos. São cerca de 4,5 milhões de registros que hoje, no GBIF, representam 70% dos dados de ocorrência de espécimes que têm como origem coleções brasileiras.

Através desse post queremos divulgar um importante indicador que o GBIF disponibiliza para todas as coleções participantes, denominado CITATIONS. Para cada download de dados feito no GBIF é atribuído um identificador único denominado DOI (Digital Object Identifier) que o usuário deve citar como referência aos dados utilizados nas suas publicações. Com isso, é possível associar a fonte dos dados a cada publicação que cita esse DOI, atribuindo a cada coleção os artigos que usaram seus dados.

A figura a seguir mostra a página encontrada para a coleção URM - Herbário Pe. Camille Torrand da Universidade Federal de Pernambuco no GBIF.


A página do herbário URM apresenta informações como o número de registros no GBIF (87,669), o número de citações (13 CITATIONS) e a data da última atualização dos dados (05 de maio de 2018). Também apresenta a aba METRICS, com elementos indicando a qualidade, completude e distribuição taxonômica dos dados.

Mas nesse post queremos destacar o indicador CITATIONS que recupera todas as publicações que citaram DOIs dos downloads que possuem dados do herbário URM. A figura a seguir traz informações sobre duas dessas publicações.



Os artigos são clicáveis e acessando o DOI indicado, é possível obter a quantidade de dados utilizados de cada coleção.

O herbário URM apresenta 3 artigos de 2018 que citam o uso de seus dados. Certamente essa informação é um indicador que mostra a relevância e disponibilidade desse acervo. No entanto, o GBIF alerta ao fato que essa métrica ainda não reflete o uso real dos dados, uma vez que a maioria dos artigos ainda não usa o DOI dos downloads. Consideram ser necessário trabalhar junto aos pesquisadores e editores para melhorar a prática de citação dos dados. Voltando à página do herbário URM, clicando em ACTIVITY, o sistema mostra mais de 7 mil downloads que envolveram dados do acervo URM. É um indicativo que o número de citações em publicações que indicam o DOI do download é muito baixo.

Assim, queremos divulgar mais esse indicador disponível na rede Global que, na nossa opinião, demonstra a importância do compartilhamento aberto de dados e o reconhecimento da comunidade científica global aos dados, portanto, ao trabalho das coleções biológicas brasileiras. Vale a pena conferir!

Aproveito a oportunidade para agradecer ao Daniel Noesgaard (Science Communications Coordinator), Kyle Copas (Communications Manager) e Tim Hirsch (Deputy Director) todos do GBIF, que me explicaram o conceito e a metodologia usada para apresentar esses indicadores.

12 de abr de 2018

O INCT-Herbário Virtual da Flora e dos Fungos ultrapassa o marco de 6 milhões de registros online




O Herbário Virtual da Flora e dos Fungos hoje compartilha mais de 6,1 milhões de registros e 1,9 milhão de imagens online através da rede speciesLink. São 171 conjuntos de dados de herbários e fototecas do país e 26 do exterior, com herbários participantes em todas as regiões do país. Cerca de 5,8 milhões de registros são de coletas realizadas no Brasil.



Cycas revoluta (LUSC 6531)
Herbário de Lages da Universidade do Estado de Santa Catarina


Em 2017, o Herbário Virtual integrou 441 mil novos registros e 583.105 novas imagens à rede, sendo cerca de 260 mil novas imagens do Jardim Botânico de Nova Iorque. Esses totais representam uma média de 1.208 novos registros e 1.598 novas imagens por dia.

Em 2018, os herbários compartilham 184 mil novos registros e 39.801 novas imagens online. Essa evolução se dá não só através da integração de dados de novos herbários, mas graças ao trabalho de digitação e atualização dos dados online. As colunas do gráfico abaixo representam o número de atualizações mensais e a linha, o número de conjuntos de dados online em cada mês. Podemos observar que na maioria dos meses vários herbários atualizam seus dados mais de uma vez. O gráfico reflete o dinamismo da rede, resultante direto da ação do INCT-Herbário Virtual da Flora e dos Fungos.


Estatísticas do Uso dos Dados (inct.splink.org.br/showUsage)


Uma consequência direta do compartilhamento aberto de dados e imagens é o crescimento do seu uso. Mais de 530 milhões de registros do Herbário Virtual foram utilizados em 2017, o que representa uma média de 1,45 milhão de registros utilizados por dia. Também em 2017 foram visualizadas mais de 3 milhões de imagens, o que representa uma média de cerca de 9 mil imagens visualizadas por dia.

Em 2018 a consulta feita por usuários ao Herbário Virtual já é superior a 121 milhões de registros e 940 mil imagens.




As perspectivas são de contínuo crescimento, com a adesão de novos herbários ao sistema e a melhoria da qualidade dos dados dos acervos.

6 de fev de 2018

geoApis - Plataforma de informação sobre Apicultura e Meio Ambiente


http://abelha.org.br/geoapis
abelha.org.br/geoapis

A tecnologia aliada a uma nova cultura colaborativa pode ajudar a fortalecer a apicultura e proteger as abelhas no Brasil. 

Essa é a proposta da geoApis, uma plataforma digital inovadora que cria uma rede integrando associações apícolas e produtores de mel. A ferramenta permite o compartilhamento de informações de forma colaborativa, contribuindo para a profissionalização e melhor eficiência dos apiários.




 A geoApis é um novo sistema de informação comunitária desenvolvido pela Associação Brasileira de Estudo das Abelha (A.B.E.L.H.A.) em parceria com o Centro de Referência em Informação Ambiental (CRIA) e a MD Educação Ambiental.

 As associações que tiverem interesse em participar devem entrar em contato pelo e-mail o geoApis@abelha.org.br. A equipe da geoApis irá pessoalmente na entidade apresentar a plataforma, formalizar a parceria e dar treinamento.

8 de jan de 2018

Lacunas – versão janeiro de 2018

http://lacunas.inct.florabrasil.net



Em setembro de 2012 foi lançado o sistema Lacunas com o objetivo de cruzar os dados disponíveis no INCT – Herbário Virtual da Flora e dos Fungos com os dados publicados na lista oficial das espécies da flora e dos fungos que ocorrem no Brasil.

A ideia foi criar uma ferramenta para facilmente identificar as lacunas de dados taxonômicos e geográficos do INCT - Herbário Virtual. Com essa informação, o Comitê Gestor do INCT pode priorizar a integração de novos acervos, a digitação de dados e ações para melhorar a qualidade dos dados on-line.

O banco de dados do sistema permite buscas fonéticas, além de permitir a associação dos sinônimos a cada nome científico aceito. Assim o sistema permite comparar buscas exatas com fonéticas e buscas somente com nomes aceitos ou com a inclusão de sinônimos. Com isso é possível também avaliar qualitativamente a necessidade de atualização dos nomes e correção de erros de digitação pelas coleções.

Figura 1. Alguns elementos do relatório Lacunas para Angiospermas (Fonte: Lacunas, Jan/2018)


Uma nova versão dos relatórios é produzida, no mínimo a cada seis meses, o que permite observar a evolução qualitativa do Herbário Virtual.

A Lista de Espécies da Flora do Brasil, coordenada pelo Jardim Botânico do Rio de Janeiro, hoje denominada Flora do Brasil 2020, também evoluiu desde 2010, introduzindo novos elementos e novas espécies. Essas mudanças foram também introduzidas no Lacunas. Hoje, por exemplo, é possível avaliar o status dos dados dos diferentes grupos taxonômicos (algas, angiospermas, briófitas, fungos, gimnospermas e samambaias e licófitas) selecionando apenas espécies nativas, cultivadas ou naturalizadas.

Nesse período também houve a avaliação do CNCFlora do status de conservação das espécies da flora do Brasil e o MMA publicou nova portaria com o status das espécies ameaçadas de extinção. Esses dados também foram incorporados ao sistema.


O gráfico a seguir mostra uma análise do número de espécies sem registros no Herbário Virtual em janeiro de 2018, de acordo com dois critérios: (1) busca fonética, incluindo sinônimos, com ou sem coordenadas geográficas e (2) busca fonética, incluindo sinônimos, com coordenadas originais consistentes e distintas, ou seja, com coordenadas informadas pelas coleções. A segunda opção não considera os registros com coordenadas georreferenciadas automaticamente por aplicativo.



O gráfico mostra, de maneira clara, lacunas mais significativas de dados dos grupos Algas e Fungos. Esses grupos também têm mais problemas com o georreferenciamento de seus dados. Fungos que têm cerca de 35% das espécies citadas na Flora 2020 sem dados no Herbário Virtual, mas passa a ter 77% se considerarmos apenas registros com coordenadas consistentes e distintas, informadas pela coleção. Essa comparação mostra que além de integrar mais dados desses grupos taxonômicos é necessário trabalhar no seu georreferenciamento.

Até mesmo as espécies que constam na Lista Nacional Oficial de Espécies da Flora Ameaçadas de Extinção - Portaria nº 443 de 17 de dezembro de 2014 apresentam 2% das espécies sem registros no herbário virtual e 14% sem registros se considerarmos coordenadas geográficas consistentes e distintas, informadas pela coleção.

Muitas outras análises podem ser realizadas, inclusive por famílias e gêneros. Reiteramos que os relatórios estão disponíveis on-line, abertos a todos e os blogs do CRIA e do INCT-Herbário Virtual estão abertos a todos que queiram publicar suas análises.