22 de abr de 2016

Estatística de Uso dos Dados da rede speciesLink


Uma nova ferramenta para mostrar a importância das coleções biológicas do país e do exterior


O CRIA tem o prazer de anunciar o lançamento de uma nova ferramenta da rede speciesLink: “Estatísticas do Uso dos Dados”. Desenvolvida no escopo do projeto INCT-Herbário Virtual da Flora e dos Fungos, com o apoio do CNPq, a ferramenta apresenta o número de registros e imagens utilizados pelos usuários por coleção ou grupo de coleções, ou por toda a rede, desde outubro de 2012, quando a nova interface de busca do specieslink foi lançada. Cada coleção pode analisar o uso dos dados do próprio acervo on-line, em qualquer período, em tempo real.

Uso dos dados da rede speciesLink entre 05 de outubro de 2012 e 22 de abril de 2016

Dos cerca de 1,6 bilhão de registros utilizados entre outubro de 2012 a abril de 2016, 80% foram de registros provenientes de herbários, sendo 98% de herbários associados ao INCT-Herbário Virtual da Flora e dos Fungos, demonstrando o valor dos projetos de apoio a essa infraestrutura científica tão importante para o país.

Lembramos que esses números referem-se apenas ao acesso aos dados através da interface de busca da rede speciesLink. O acesso aos dados através de serviços web (p.ex. pela Lista de Espécies da Flora do Brasil, da Flora do Brasil 2020 e dos sistemas BioGeo e Lacunas) não é computado. Como também não são computados o acesso aos dados nos sistemas GBIF e SiBBr.

Trata-se de uma análise quantitativa, mas que evidencia o impacto do compartilhamento aberto de dados. Esperamos, com isso, oferecer uma métrica que contribua para que cada coleção possa mostrar a relevância do seu trabalho, reforçando também a importância do esforço coletivo dos projetos em rede. 

A imagem apresentada a seguir mostra a proporção entre o número médio de registros disponíveis on-line no período analisado e o número de registros utilizados. Para toda a rede speciesLink, foram utilizados cerca de 470 vezes o número de registros disponíveis.


Pode-se também dimensionar a importância da repatriação de dados. Novamente utilizando o INCT-Herbário Virtual da Flora e dos Fungos como exemplo, tem-se que os 522 mil registros repatriados no âmbito do programa Reflora do CNPq, resultaram em cerca de 160 milhões de registros utilizados e 1,2 milhão de imagens servidas.

Outro elemento importante na análise do uso dos dados é o perfil do usuário e o tipo de uso dos dados, que são objetos de estudo de uma pesquisa em andamento, tema do nosso blog do dia 08 de abril de 2016.


A pesquisa até o momento indica um usuário qualificado (30% com doutorado, 20% doutorandos, 15% com mestrado, 15% mestrandos, 16% com ensino superior e 1% com ensino médio), sendo 86% associados a universidades, institutos de pesquisa e instituições governamentais. É importante observar que 6% são do setor privado, ligados à prestação de serviços e consultorias. 3% são de ONGs e mais 3% de escolas de ensino fundamental e médio.

Tem-se que 43% dos usuários utilizam os dados em suas pesquisas e 19% em ensino. Assim, além da pesquisa em taxonomia e sistemática, biogeografia, conservação e ecologia, e do ensino em botânica, ecologia, zoologia e micologia, destacamos entre outros usos, a produções das listas da fauna, flora e micota do país, o planejamento de novas coletas, a produção das listas de espécies ameaçadas de extinção, o estudo de impacto ambiental, a gestão ambiental e políticas públicas.

Solicitamos aos usuários da rede speciesLink que ainda não contribuíram com a pesquisa sobre o uso dos dados, que o façam.

Com essas ferramentas, esperamos contribuir para um maior reconhecimento da importância das coleções biológicas na promoção da ciência e educação e na elaboração de políticas públicas. Esperamos também demonstrar a importância da e-infraestrutura pública, que oferece dados, imagens e ferramentas a qualquer pessoa interessada, de forma livre e aberta.




8 de abr de 2016

Pesquisa sobre o uso dos dados e perfil do usuário da rede speciesLink

Objetivo: compreender quem está usando a rede e com que finalidade, para melhorar os serviços oferecidos


Com o apoio da Fapesp, o CRIA lançou em outubro de 2002 a rede speciesLink com informação sobre espécies e espécimes da fauna, flora e microbiota, integrando dados de acervos de 12 coleções biológicas do estado de São Paulo. Após uma década de evolução, a rede integra 415 conjuntos de dados de plantas, fungos, animais, microrganismos e fósseis. São mais de 7,6 milhões de registros textuais e mais de um milhão de imagens on-line, todos de acesso livre e aberto.

Visando agregar valor e funcionalidade à infraestrutura, foram desenvolvidas ferramentas para a visualização dos dados (produção de inventários, mapas, gráficos, catálogos) e melhoria da qualidade dos dados (indicadores de erros potenciais e relatórios de qualidade - dataCleaning), além de ferramentas de suporte à ciência colaborativa (BioGeo e Anotações), e o sistema para a análise das lacunas de dados e de conhecimento taxonômico e geográfico - Lacunas.

Análises do acesso aos dados através da interface de busca em 2015, mostram que mais de 4 bilhões de registros atenderam aos critérios de busca dos usuários Desses, cerca de 480 milhões de registros e mais de 3 milhões de imagens foram utilizados. Tem-se ainda que o sistema registra uma média de 30 mil visitas mensais, sendo 95% dos acessos de computadores localizados no Brasil.

Visando melhorar os serviços e identificar novas demandas, o CRIA preparou um questionário com o intuito de avaliar o perfil dos usuários e finalidade de utilização dos dados. O questionário foi disponibilizado on-line no dia 29 de março e até o momento foram recebidas 390 respostas que serviram de base para a análise preliminar apresentada a seguir. 

43% do uso da rede está relacionado com atividades de pesquisa, 19% para ensino e 37% para outras finalidades.  No uso em pesquisa, merece destaque a área de taxonomia e sistemática, seguida de biogeografia, conservação, ecologia e macroecologia. Nas atividades de ensino predomina o uso em botânica, seguida pela ecologia, zoologia, micologia e microbiologia. Com referência a “outros usos” a pesquisa indica a produção de listas de flora, fauna, micota e de espécies ameaçadas, o planejamento de novas coletas, estudos de impacto ambiental, políticas públicas e gestão ambiental, com alguns usos em menor escala, em bioprospecção e biotecnologia.



Quanto ao perfil dos usuários, a grande maioria reside no Brasil e tem pós graduação. Mais da metade atua em universidades, mas é importante destacar os serviços prestados pela rede a usuários do setor privado, escolas e ONGs.


25% das respostas incluíram comentários, sugestões e novas demandas como:
  • ampliar a oferta de imagens de melhor qualidade; 
  • melhorar e ampliar o BioGeo, ferramenta para produção e publicação de modelos de distribuição de espécies;
  • desenvolver uma interface de busca por polígonos geográficos;
  • uso de pacotes R;
  • várias sugestões sobre ferramentas que trabalham com a qualidade dos nomes das espécies;
  • organização dos dados de fenologia;
  • várias sugestões sobre a interface de busca;
  • aplicativos para celulares;
  • tratamento de duplicatas;
  • maior compatibilidade com Brahms; e,
  • integração dos dados com outras fontes de informação.
Algumas destas sugestões já foram incluídas na nova proposta do Instituto Nacional de Ciência e Tecnologia Herbário Virtual da Flora e dos Fungos submetida ao CNPq em 2014, e aguarda avaliação e contratação.

Os resultados dessa pesquisa certamente irão orientar os trabalhos, não só quanto a desenvolvimentos futuros, mas também quanto ao estabelecimento de novas parcerias para complementar as informações disponíveis e para atender outros públicos e novas demandas.

Agradecemos a todos que colaboraram com as suas ideias e solicitamos àqueles que utilizam os dados da rede speciesLink que ainda não responderam à pesquisa, que o façam para que possamos atender cada vez melhor.


Apoio: