Mostrando postagens com marcador Herbário Virtual. Mostrar todas as postagens
Mostrando postagens com marcador Herbário Virtual. Mostrar todas as postagens

20 de mar. de 2014

Herbário FLOR recebe visita para discutir a qualidade dos dados

A visita da equipe do INCT-HVFF, em parceria com o CRIA, teve como objetivo incentivar curadores, técnicos, pesquisadores e alunos a prezar pela qualidade dos dados dos espécimes. Particularmente, a visita visou aprofundar a participação dos micólogos e discutir a inclusão de imagens dos espécimes de fungos na rede speciesLink.

Professores e alunos do Micolab na UFSC. O aumento do número de alunos reflete maior interesse nos fungos, em grande parte motivado pela presença de jovens pesquisadores.

O Herbário FLOR da Universidade Federal de Santa Catarina (UFSC) possui uma coleção online com cerca de 42.000 registros de espécimes de plantas vasculares, 6.000 de fungos e 1.000 de algas. O acervo do herbário está voltado especialmente para a flora e micota da região Sul do Brasil. O herbário faz parte da rede INCT Herbário Virtual da Flora e dos Fungos desde julho de 2011 e vem contribuindo com um acréscimo de quase 10.000 registros por ano. A maior parte da coleção é de plantas, mas o número de espécimes de fungos tem grande potencial de aumentar com a participação de dezenas de alunos de graduação e de pós-graduação do Laboratório de Micologia (Micolab), liderado pelos Profs. Maria Alice Neves e Elisandro Ricardo Drechsler-Santos.

Histórico da evolução do número total de registros online e registros georreferenciados do herbário FLOR.
 
Zelando pela qualidade dos dados
O herbário FLOR tem uma bióloga contratada que é responsável pelo banco de dados, exercendo um papel chave para a qualidade das informações disponibilizadas. De uma forma geral, os dados taxonômicos estão bem cuidados, mas uma grande proporção dos registros não possui coordenadas geográficas originais, ou seja, informadas pela própria coleção. Isso se deve em parte à carência de informações nas coletas mais antigas, mas também à falta de uma cobrança sistemática por parte dos curadores e técnicos.

Silvia Venturi, bióloga responsável pelo banco de dados de FLOR, e Eduardo Michelena, seu estagiário.

Durante a visita, foram discutidas as melhores práticas para realizar o georreferenciamento. O formato de graus decimais foi sugerido como formato padrão, pois reduz muito a chance de inclusão de erros. Além disso, algumas dicas sobre a utilização de aparelhos de GPS em campo foram passadas, com ênfase para a configuração prévia do formato da coordenada para graus decimais e do datum para WGS84. Para coletas antigas ou recentes sem coordenadas é possível fazer o georreferenciamento retrospectivo, um conjunto de técnicas que atribui uma coordenada geográfica com base nas informações escritas sobre a localidade. Softwares populares, como o Google Earth, são adequados à tarefa, pois conciliam uma interface amigável dos mapas de satélite com um banco de dados com nomes de localidades que funcionam bem para a maior parte do planeta. Outra ferramenta de acesso aberto é o GeoLoc, que fornece coordenadas geográficas para um determinado município ou para o nome completo ou parcial da localidade. Também bastante útil é o conversor, ferramenta que permite a conversão de diferentes tipos de representação de coordenadas geográficas e datums disponíveis no Brasil. Ambas permitem que a conversão de coordenadas ou a busca por localidades seja feita individualmente ou em lotes.

Interface do geoLoc (http://splink.cria.org.br/geoloc).

Panorama da coleção de fungos
Atualmente não existe uma separação estrutural na rede speciesLink entre as coleções de fungos e plantas. Porém, devido ao preenchimento completo das informações do campo ‘Reino’ para todos os espécimes de fungos é possível analisar a coleção de fungos de FLOR de maneira independente. Hoje existem 5.875 espécimes de fungos com dados online, sendo o filo Basidiomycota o mais representado, com 4.911 amostras, seguido de Ascomycota, com 443 amostras.

Caixas com espécimes de fungos macroscópicos depositados no herbário FLOR. Atualmente existem cerca de 6.000 registros de fungos online, mas nenhum possui imagens associadas.

O acervo tem um viés mais voltado aos fungos decompositores da madeira, decorrente da contribuição da Profa. Clarice Loguércio Leite, que durante anos lecionou micologia na UFSC com foco nesse grupo de fungos, contribuindo para a formação de micólogos que hoje estão formando a nova geração. As principais famílias de fungos representadas em FLOR são Polyporaceae (1.513 registros), Hymenochaetaceae (661), Ganodermataceae (340) e Agaricaceae (244), mas o acervo está sendo diversificado com o fortalecimento do Micolab.
 
A contratação de jovens professores tem permitido a participação de diversos alunos em pesquisas com fungos.

Os espécimes de fungos depositados no herbário FLOR foram coletados principalmente no Brasil. A distribuição geográfica das coletas está concentrada principalmente na região Sul, com maior densidade no estado de Santa Catarina, mas o herbário FLOR também abriga coletas importantes feitas na Amazônia e no Nordeste.

Distribuição das localidades dos espécimes de fungos depositados em FLOR e presentes na rede speciesLink. Em azul, coordenadas georreferenciadas pelo município; em vermelho, coordenadas originais informadas pela coleção.

O dinamismo atual do Micolab é refletido pelo grande número de alunos participantes e pela diversidade de grupos de fungos estudados, mostrando que a micologia passa por um importante momento de desenvolvimento que deve contribuir para aumentar nosso conhecimento sobre a diversidade de fungos no Brasil. Contudo, alguns aprimoramentos do sistema speciesLink podem ajudar a tornar a ferramenta ainda mais útil para a comunidade científica. Uma delas é a associação das imagens dos espécimes aos dados textuais.

O Micolab conta com uma estrutura bastante completa que potencializa a formação dos jovens micólogos.

Imagens para espécimes de fungos
Um dos objetivos da visita foi levantar as demandas dos micólogos em relação à inclusão de imagens dos espécimes de fungos no INCT-Herbário Virtual, via rede speciesLink. Durante a visita foram discutidas questões relacionadas à padronização e operacionalização dessa demanda. Atualmente o INCT-Herbário Virtual não possui imagens de espécimes de fungos do herbário FLOR, mas os pesquisadores e alunos fazem uso cotidiano de imagens macro e microscópicas para auxiliar a identificação das espécies. Assim, há um interesse natural em associar as imagens aos registros textuais.

Alunos trabalhando no Micolab. Associar imagens dos espécimes de fungos vai ajudar a tornar acessíveis informações essenciais para a identificação das espécies.

Foram discutidas as principais categorias de imagens que usualmente estão associadas aos espécimes e houve uma dinâmica para informar quais campos são essenciais para cada grupo de fungos. Outros pontos importantes envolvem a questão das escalas, legendas e créditos das imagens. Essas informações estão sendo compiladas e transmitidas à equipe do CRIA, responsável pelo desenvolvimento do sistema.

Maria Alice Neves, docente da UFSC, que está ajudando a formar novos micólogos no Brasil.

Embora os fungos sejam menos conhecidos do que plantas e animais, o número de alunos e a estrutura existente no Micolab prometem contribuir para a geração de conhecimento sobre a diversidade e distribuição das espécies de fungos que ocorrem no Brasil, ajudando a reduzir essa falta de conhecimento histórica. A rede speciesLink, que mantém e disponibiliza os dados dos herbários vinculados ao INCT-Herbário Virtual, possui uma estrutura bastante completa, mas a qualidade dos dados é determinante para o tipo de uso que essas informações podem ter. A visita favoreceu não apenas a realização do trabalho proposto, mas o estreitamento de vínculos que tenderão a aumentar o comprometimento dos envolvidos em promover a melhoria da qualidade dos dados sobre fungos, bem como o aprimoramento do sistema, visando ampliar sua utilidade para a comunidade científica.


Saiba mais!

Créditos
Texto e fotos - Ricardo Braga-Neto
*atualizado em 22.03.2014

23 de jan. de 2014

Novidades na ferramenta Duplicata do dataCleaning

Novos filtros e agrupamentos dos dados facilitam a identificação de determinações distintas para duplicatas de plantas em diferentes herbários. A ferramenta Duplicata visa auxiliar curadores e técnicos de herbários a identificar e corrigir erros e a atualizar e completar os dados.


Exsicatas da mesma coleta depositadas em herbários diferentes podem ter identificações distintas. A exsicata depositada no herbário FLOR (à esquerda) representa a coleta número 10806 de J. Mattos realizada em 15 de dezembro de 1962 em Conceição da Barra, Espírito Santo, Brasil. A exsicata do mesmo material depositada em SP (à direita) foi identificada como Eugenia hirta O.Berg. por M. Sobral em setembro de 1991, mas a duplicata de FLOR permanece sem atualização da identificação inicial.
 
Durante visitas promovidas pelo CRIA e INCT-Herbário Virtual da Flora e dos Fungos para discutir a qualidade dos dados disponibilizados online, curadores e técnicos dos herbários sugeriram algumas melhorias que foram implementadas recentemente. Essas melhorias incluem novos filtros e formas de visualização do relatório, e, quando disponível, a apresentação da imagem da exsicata. Registros "suspeitos" detectados pela ferramenta Duplicata são aqueles que possuem o mesmo nome, número de coletor e data de coleta, mas informações distintas nos campos "gênero + espécie + subespécie".

Um dos grandes problemas na identificação de duplicatas nos diferentes herbários através de um aplicativo era a falta de padronização do nome do coletor. A ferramenta agora reconhece variações na ordem da escrita do nome e iniciais dos coletores. Por exemplo, D. Alvarenga é reconhecido como sendo o mesmo que Alvarenga, D.. O sistema também reconhece como sendo o mesmo o coletor isolado ou o coletor principal quando registrado juntamente com os coletores secundários. Por exemplo, A.A. Ribeiro-filho é considerado isoladamente ou quando associado com outros coletores, como no caso A.A. Ribeiro-filho, L.C. Soares. 


A tabela apresentada pode ser ordenada por nome do coletor, família ou gênero, facilitando o trabalho do curador que quiser analisar os dados por família, por exemplo. Cada linha é clicável e permite navegação dinâmica. A tabela apresenta também o nome do determinador e data de determinação, assim como novos filtros como família ou gênero indeterminados para que seja possível rapidamente comparar esses registros com duplicatas de outros herbários participantes da rede speciesLink.

Esperamos com isso facilitar o trabalho de atualização da nomenclatura taxonômica dos acervos. Com o uso da ferramenta, herbários que não possuem especialistas de determinados grupos taxonômicos podem se beneficiar do trabalho de identificação do material em outros herbários e, dessa forma, contribuir para a melhora da qualidade dos dados da rede do Herbário Virtual.

 

Saiba mais!

28 de nov. de 2013

INCT-Herbário Virtual e CRIA participam do 64˚ Congresso Nacional de Botânica

Entre os dias 10 e 15 de novembro, aconteceu em Belo Horizonte o 64o Congresso Nacional de Botânica. O INCT-HVFF e CRIA expuseram os principais resultados em um estande e contribuíram com palestras, apresentações de trabalhos e um curso que antecedeu ao congresso.

Mesa composta por Leonor Costa Maia, Ana Odete Santos Vieira, Livia Echternacht e Dora Ann Lange Canhos no simpósio Flora Virtual do Brasil: dados e ferramentas durante o 64 Congresso Nacional de Botânica.

A participação do INCT - Herbário Virtual da Flora e dos Fungos (INCT-HVFF) foi destacada no simpósio “Flora virtual do Brasil: dados e ferramentas”, no qual Leonor Costa Maia, coordenadora do Instituto, apresentou a palestra “INCT – Herbário Virtual da Flora e dos Fungos: há cinco anos aprimorando o trabalho em rede e incrementando o conhecimento sobre a diversidade brasileira”. Em seguida, Dora Ann Lange Canhos apresentou os sistemas Lacunas e BioGeo que podem ser úteis para o planejamento de coletas e para políticas públicas.

 Dora Canhos e Leonor Maia apresentaram um panorama dos 5 anos do INCT Herbário Virtual e ferramentas para planejamento de coletas (crédito das imagens: Gustavo Shimizu).

Durante todo o evento a equipe do INCT-HVFF mostrou os principais produtos do instituto em um estande, expondo vídeos, os sistemas online, fotos e distribuindo materiais para os interessados. Os usuários dos sistemas de informação puderam tirar dúvidas a respeito de como disponibilizar dados online, receberam dicas de como fazer consultas no speciesLink, como gerar modelos utilizando o BioGeo, como identificar áreas e táxons pouco amostrados utilizando o Lacunas, como inserir imagens nos dados textuais e como melhorar a qualidade dos dados utilizando o dataCleaning.

Estande do INCT-Herbário virtual mostrando videos, fotos e tirando dúvidas dos interessados.

Além desses trabalhos, dois pôsteres foram apresentados. No trabalho “Diagnóstico da qualidade dos dados disponibilizados por herbários brasileiros” foi apresentado um panorama geral sobre a qualidade dos mais de 4 milhões de registros atualmente online, mostrando a importância da curadoria de dados em cada um dos herbários participantes da rede e sugerindo ferramentas para correção de dados e formas de evitar a inclusão de novos erros.

O trabalho sobre o diagnóstico da qualidade dos dados disponibilizados por herbários brasileiros mostra a importância da curadoria de dados (crédito da imagem: Gustavo Shimizu).

No trabalho “Lacunas e BioGeo: Novas Ferramentas para o Planejamento de Coletas” foi apresentado um panorama dessas duas ferramentas que utilizam como base os registros disponíveis na rede speciesLink. O Lacunas permite a visualização de mapas de ocorrência de espécies de plantas e fungos do Brasil, e agrega informações sobre o status dos dados sobre os espécimes disponíveis online, endemismos e elementos para avaliar o conhecimento digital sobre as espécies ameaçadas de extinção. O BioGeo visa ampliar o conhecimento sobre a biogeografia de plantas e fungos do Brasil, disponibilizando um ambiente computacional amigável para que especialistas possam modelar o nicho ecológico das espécies de seu interesse e publicar o modelo resultante para acesso público.

Um panorama sobre o Lacunas e o BioGeo foi apresentado também na forma de poster.

Como atividade pré-congresso, nos dias 9 e 10 de novembro, foi oferecido o curso “Curadoria de dados de herbário com ênfase no software BRAHMS” do qual participaram 11 pessoas, dentre curadores, técnicos e estagiários. O curso foi ministrado por Marina Melo (UB) e Flávia Pezzini (INCT-HVFF/CRIA) que mostraram os principais procedimentos para curadoria e melhoria da qualidade dos dados utilizando o software BRAHMS.

Participantes do curso Curadoria de dados de herbário com ênfase no software BRAHMS no campus da UFMG em Belo Horizonte. 

Durante o Congresso também foi lançado o “Manual de procedimentos para Herbários”, produto do INCT-HVFF, que visa divulgar as práticas para preservação de plantas e fungos.

A participação do público nas atividades oferecidas pelo INCT-HVFF foi muito positiva, mostrando que os serviços oferecidos são de grande utilidade para a comunidade. É imprescindível ressaltar que a força do INCT está na integração e participação de cada um dos mais de 90 herbários que compõem a rede compartilhando dados de forma aberta e livre na internet.


Saiba mais!

19 de nov. de 2013

Conhecimento digital acessível e prioridades para o inventário de plantas no Brasil

Artigo publicado na revista Diversity and Distributions usa dados primários de biodiversidade disponíveis na internet para avaliar lacunas de conhecimento da flora do Brasil, considerando efeitos geográficos e ambientais sobre os padrões de distribuição.


Estima-se que o Brasil abriga cerca de 20% da diversidade mundial de angiospermas, possuindo a flora mais rica e endêmica dos Neotrópicos. Embora os estudos botânicos tenham iniciado há mais de um século, apenas uma parte do território nacional foi amostrada. Até pouco tempo atrás era inviável fazer uma avaliação quantitativa do esforço de coletas reunindo informações da maior parte dos herbários, pois os dados não estavam disponíveis em uma base consolidada. Entretanto, a integração e a disponibilização aberta desses dados na internet por meio da rede speciesLink tornou possível avaliar a representatividade geográfica, ambiental e taxonômica das coletas no país. A rede speciesLink constitui a base do sistema de informação que alimenta o INCT-Herbário Virtual da Flora e dos Fungos, contribuindo para integrar dados de herbários nacionais e do exterior.

Os resultados foram publicados recentemente na revista Diversity and Distributions por Mariane S. Sousa-Baena, Letícia C. Garcia e A. Townsend Peterson. "O objetivo foi utilizar os dados disponíveis para revelar os espaços geográficos onde estão as maiores lacunas de conhecimento, uma informação que pode ajudar a orientar a realização de novas coletas e também a elaboração de planos para a conservação da flora", explica Mariane.


A distribuição espacial da densidade de coleta de angiospermas indica uma concentração na região costeira (a) e uma tendência à agregação em torno de cidades e estradas (b).


Representatividade das coletas
No estudo, foram utilizados dados de cerca de 1,7 milhões de espécimes distribuídos em 88 herbários (83 do Brasil e 5 do exterior). As informações geográficas provêm de coordenadas originais informadas pela coleção ou derivadas do centróide do município (via aplicativo). Além da projeção bruta dos pontos de coleta, diferentes escalas espaciais foram utilizadas para analisar os padrões, incluindo divisões políticas estaduais, ecorregiões e píxeis com resolução espacial de 1o, 1/2o e 1/10o.

Para avaliar quão representativas são as coletas de angiospermas no Brasil, os autores utilizaram uma medida de completude (completeness) e com base no conhecimento de espécies observadas foi estimado o número esperado de espécies para cada píxel, estado ou ecorregião. Áreas com baixa completude têm maior chance de abrigar novos registros de espécies já descritas ou espécies novas, e portanto devem ser tratadas como prioridade para novos esforços de coleta. No mapa abaixo é possível perceber que poucos locais são bem conhecidos floristicamente, de forma que a maioria possui poucas ou até mesmo nenhuma amostra. Embora o mapa com píxeis mais extensos (1o) indique uma completude do inventário maior no Brasil como um todo, em uma escala mais fina (1/10o) é possível observar que na realidade píxeis bem amostrados estão restritos a alguns locais pontuais, separados por grandes lacunas de conhecimento.

Padrões geográficos da completude dos inventários florísticos no Brasil para diferentes resoluções espaciais. Cores quentes indicam altos valores de completude e frias valores baixos.


Incorporando informações ambientais
O estudo procura aprimorar a visão da distribuição espacial dos registros com informações sobre a variação ambiental, baseadas em informações climáticas, levando em conta a distância geográfica das lacunas de sítios bem conhecidos. Integrando todas estas informações foi possível identificar se as lacunas de amostragem eram climaticamente semelhantes ou distintas, e/ou geograficamente próximas ou distantes de sítios bem conhecidos. A taxa de variação nas condições ambientais é importante, pois áreas relativamente uniformes podem ser caracterizadas floristicamente por amostragens mais esparsas, enquanto áreas com maior variação nas condições ambientais requerem uma amostragem mais intensa. As quatro principais lacunas de amostragem reveladas indica a região da cabeça do cachorro no noroeste da Amazônia, a região da Serra do Tumucumaque no Amapá, uma ampla região no arco do desmatamento entre o Pará e o Mato Grosso, além de uma região de campos a oeste do Rio Grande do Sul.

Representação da variação climática no Brasil para píxeis de 1/2 grau (a), distância geográfica de sítios bem conhecidos (b) e de áreas geograficamente distantes e ambientalmente distintas daquelas de sítios bem conhecidos (c). Cores frias indicam distâncias menores, cores quentes distâncias maiores e píxeis pretos indicam sítios bem conhecidos floristicamente. A sobreposição do mapa 'c' com o mapa de uso da terra permite diferenciar áreas com cobertura natural (escuras) de áreas com forte alteração (claras) em (d), (e) e (f).

Algumas das lacunas identificadas estão localizadas em regiões de intensa pressão de conversão de terras que precisam de ser investigadas antes que desapareçam. A região Sudeste possui apenas pequenos fragmentos florestais isolados, e regiões no sul do Pará sofrem pressões de desmatamento ao longo da rodovia BR-163, onde inclusive existe uma lei (LEI Nº 12.678, DE 25 DE JUNHO DE 2012) que diminuiu e modificou o limite de diversos parques da região por pressões de mineradoras e hidrelétricas. Sem conhecer a flora, é impossível sabermos qual é a perda de espécies que o desmatamento contínuo poderá causar.

Perspectivas
Não existe consenso sobre quantas espécies de plantas existem no Brasil, mas as estimativas variam entre 40 e 50 mil espécies. De acordo com a Lista de Espécies da Flora do Brasil (2013), existem 32.000 espécies de angiospermas reconhecidas para o país. A flora da região Sudeste e Nordeste são melhor conhecidas, pois abriga a maior parte dos institutos de pesquisa e recursos humanos especializados, mas mesmo essas regiões têm importantes lacunas de conhecimento taxonômico quando se considera uma escala mais fina. A Amazônia permanece como a região mais desconhecida: cerca de 40% da área nunca foi amostrada e o conhecimento existente está concentrado em alguns sítios. Entretanto, regiões importantes no estado do Tocantins e o oeste do Mato Grosso também abrigam potencialmente muitas espécies desconhecidas.

O estudo ilustra o potencial de utilização de dados primários da biodiversidade integrados e compartilhados abertamente na internet para a pesquisa científica e para a definição de políticas de conservação no país. Ainda que uma parte dos dados existentes para o Brasil não esteja disponível online (por estarem em fase de digitação ou em herbários que ainda não estão compartilhando seus dados) e que seja necessário trabalhar a qualidade dos dados disponíveis na rede, eles já são um importante subsídio para o planejamento da conservação e para orientar a realização de novas coletas. Dessa forma, as expedições de campo podem se concentrar em áreas prioritárias, maximizando o retorno do investimento nos estudos da biodiversidade da nossa flora.


http://inct.florabrasil.net/


Saiba mais!

4 de nov. de 2013

Biogeografia da Flora e dos Fungos do Brasil

Compreender melhor a distribuição geográfica de espécies é fundamental para promover a conservação da biodiversidade. Visando ampliar o conhecimento sobre a biogeografia de plantas e fungos do Brasil, foi desenvolvido um sistema para modelar a distribuição potencial das espécies, contando com a participação ativa de especialistas.

http://biogeo.inct.florabrasil.net/proc/89
Projeção de consenso entre os modelos de nicho ecológico para Passiflora mucronata (Bernacci & Giovanni 2013), indicando a área potencial de distribuição da espécie no Brasil. Prancha disponível no Herbario Virtual Flora Brasiliensis.

Visando expandir o conhecimento sobre a biogeografia das espécies de plantas e fungos do Brasil, o INCT-Herbário Virtual da Flora e dos Fungos (INCT-HVFF) desenvolveu em parceria com o Centro de Referência em Informação Ambiental (CRIA) um sistema para modelar a distribuição potencial de espécies, contando com a participação ativa de especialistas. O sistema, Biogeografia da Flora e dos Fungos do Brasil (Biogeo), foi desenvolvido no âmbito do Sistema Nacional de Pesquisa em Biodiversidade (SISBIOTA Brasil), utilizando a rede speciesLink como base de dados da ocorrência das espécies.

O sistema visa contribuir para ampliar a compreensão das necessidades ambientais das espécies, investigar diversas questões envolvendo pesquisa e conservação, indicar espécies com maior carência de dados e orientar novas coletas. O sistema abre a perspectiva para as comunidades botânica e micológica construírem um banco de dados sobre plantas e fungos que no futuro poderá conter pelo menos um modelo de distribuição potencial para cada espécie.

Parkia pendula registrada no sul da Bahia por Fábio Coppola (Flickr). Conhecida na região como Juerana, é uma árvore emergente que possui uma distribuição composta de áreas na costa do Nordeste e áreas na Amazônia.

Como funciona
A interface do sistema possui uma seção aberta, onde todos os modelos publicados podem ser visualizados, e uma seção reservada aos supervisores cadastrados, os quais são responsáveis pelo processo de modelagem das espécies. Atualmente o sistema tem 55 supervisores cadastrados e cerca de 700 espécies com modelos gerados, incluindo angiospermas, samambaias e fungos macroscópicos. Todos esses modelos podem ser vistos a partir do menu de navegação na barra superior (clicando em Taxonomia pode-se visualizar as opções disponíveis, realçadas com fundo branco) ou buscados pelo nome científico no canto superior direito.

http://biogeo.inct.florabrasil.net/proc/4582
Modelos gerados para Pycnoporus sanguineus, um fungo amplamente distribuído em regiões tropicais e subtropicais do mundo (Braga-Neto 2013). A) Corpo de frutificação: produz os esporos que são dispersos pelo vento. B) Pontos de ocorrência: Dos 594 registros disponíveis na rede speciesLink, apenas 7,9% foram incluídos na modelagem. C) Modelo de consenso: Ainda que o número de pontos seja suficiente para incluir todos os algoritmos, o modelo pode ser considerado preliminar porque existem grandes lacunas de registros com coordenadas geográficas, influenciando a qualidade final do modelo. Crédito da foto: Damon Tighe (Flickriver).

O Biogeo busca padronizar a geração de modelos e compartilhar os resultados de forma livre e aberta, permitindo que os experimentos possam ser facilmente reproduzidos e verificados pelos usuários. O sistema permite que vários modelos sejam gerados ao longo do tempo para a mesma espécie, porém somente um deles é exibido como referência. O modelo de referência é sempre o último modelo aprovado para a espécie, pois se espera que cada novo modelo seja melhor que os anteriores. Os modelos gerados ficam disponíveis para serem avaliados pelos especialistas, que podem aprovar ou descartar o resultado. O sistema utiliza dados de ocorrência de espécies disponíveis na rede speciesLink, a Lista de Espécies da Flora do Brasil 2012 como base taxonômica e variáveis ambientais bioclimáticas do WorldClim que afetam a distribuição de grande parte das espécies vegetais:
  • Altitude (modelo digital de elevação)
  • Variação média de temperatura no dia 
  • Temperatura máxima no mês mais quente 
  • Temperatura mínima no mês mais frio 
  • Precipitação no trimestre mais úmido 
  • Precipitação no trimestre mais seco 
  • Precipitação no trimestre mais quente
  • Precipitação no trimestre mais frio
O funcionamento do Biogeo é baseado na ferramenta openModeller, podendo utilizar até 5 algoritmos de modelagem, dependendo do número de pontos de ocorrência. Para espécies com menos de 5 pontos gera-se apenas um modelo de dissimilaridade ambiental através do cálculo da distância euclideana ao ponto de ocorrência mais próximo. De 5 a 9 pontos gera-se um modelo com o algoritmo Maxent; de 10 a 19 pontos são gerados dois modelos, um com o Maxent e outro com o GARP Best Subsets (GARP BS). A partir de 20 pontos são utilizados 5 algoritmos: Maxent, GARP BS, Distância Mahalanobis, ENFA e Máquina Vetores de Suporte de classe única (SVM).

A estratégia de modelagem de nicho ecológico depende do número de pontos de ocorrência disponíveis para cada espécie. Com menos de 5 pontos gera-se um modelo inicial com o objetivo de guiar novas coletas. Entre 5 e 19 pontos os modelos ainda são considerados exploratórios, mas servem como uma estimativa preliminar do nicho da espécie, sendo gerados com um ou dois algoritmos. Modelos gerados a partir de 20 pontos permitem a inclusão de todos os algoritmos, tendendo a ser mais robustos.

O trabalho é realizado separadamente para cada espécie e basicamente envolve: 1) a seleção dos nomes a serem utilizados na busca de registros de ocorrência; 2) a seleção dos registros de ocorrência a serem utilizados no procedimento de modelagem; e 3) a avaliação do modelo gerado. Embora a maior parte dos modelos originais sejam contínuos (i.e., preveem a ocorrência potencial da espécie em uma gama de valores entre 0 e 1), os modelos são também transformados em modelos binários (i.e., prevendo a ocorrência potencial da espécie em valores iguais a 0 ou 1) com base em um limiar de corte, visando facilitar a geração de um modelo de consenso que exibe apenas os locais onde há concordância entre os algoritmos utilizados. Para mostrar o funcionamento escolhemos a espécie Parkia pendula (Willd.) Benth. ex Walp. como exemplo.

http://fsi.cria.org.br/fsicache/fsi1?type=image&width=1600&height=2400&rect=0,0,1,1&profile=fsi&source=herbaria/NY/NY01190430_01.tif&
Exsicata de Parkia pendula coletada em 1979 na Estação Experimental de Silvicultura Tropical, entre Manaus e Boa Vista. A amostra está depositada no herbário do Jardim Botânico de Nova Iorque (NY 1190430), mas não foi incluída na geração dos modelos de nicho ecológico porque não possui coordenadas geográficas do local de coleta com boa precisão.


Explorando o Biogeo
O primeiro passo para gerar os modelos de Parkia pendula envolveu a seleção dos nomes a serem utilizados na busca de registros de ocorrência, considerando a possibilidade de haver sinônimos na base de dados da Lista de Espécies da Flora do Brasil ou no Tropicos. Em seguida o supervisor selecionou 50 pontos de ocorrência com a ajuda de filtros automáticos de qualidade que visam evitar a inclusão de registros com problemas de georreferenciamento ou identificação. Os pontos de ocorrência selecionados provêm de 18 herbários integrados à rede speciesLink.

Registros de Parkia pendula utilizados no procedimento de modelagem (Lima 2013).

Em seguida, os modelos foram projetados no espaço geográfico para visualização. Como existem mais de 20 pontos disponíveis para esta espécie, foram gerados modelos com base nos 5 algoritmos. No momento, a geração e a projeção dos modelos estão restritas ao território brasileiro porque a ampliação da cobertura geográfica depende de uma série de alterações não triviais, como conhecer os datums utilizados em outros países, ampliar a base de dados de estados e municípios, além de outros detalhes.

Projeções dos modelos de nicho ecológico gerados para Parkia pendula (Lima 2013). A) Extensão geográfica abordada nos modelos. B) Pontos de ocorrência. C) SVM one-class. D) Maxent original. E) Maxent binário. F) Distância Mahalanobis original. G) Distância Mahalanobis binário. H) ENFA original. I) ENFA binário. J) GARP BS original. K) GARP BS binário. L) Modelo de consenso. As áreas em vermelho em C, E, G, I e K indicam modelos binários (presença ou ausência). Os modelos D, F, H e J são contínuos e as cores quentes indicam maior probabilidade de ocorrência. As áreas em vermelho no modelo de consenso L indicam concordância entre os 5 algoritmos, em laranja 4 e em amarelo 3. 


Como avaliar os modelos gerados?
Os modelos gerados NÃO representam a distribuição real da espécie, mas sim a distribuição potencial em áreas ambientalmente adequadas à espécie de acordo com os pontos e variáveis ambientais utilizados no procedimento de modelagem. Vários motivos históricos podem ter contribuído para que a espécie não tenha ocupado todas as áreas potencialmente adequadas. Assim, a projeção do modelo é frequentemente maior que a distribuição real. O procedimento de modelagem visa gerar resultados melhores e mais precisos ao longo do tempo à medida que mais registros de ocorrência são disponibilizados. Para avaliar a qualidade dos modelos existem algumas estatísticas, como omissão interna e omissão média. Modelos com pelo menos 20 pontos de ocorrência podem ser avaliados também por meio da AUC (Area under the curve). Os modelos aprovados incluem um perfil ambiental disponível na página de detalhes do procedimento de modelagem. Procedimentos com um mínimo de 10 pontos incluem histogramas das variáveis ambientais com base nos pontos de ocorrência selecionados para a modelagem.

http://biogeo.inct.florabrasil.net/proc/3449
Condições ambientais nos pontos de ocorrência indicando para cada variável a amplitude de variação e distribuição de frequência dos valores.


Como participar?
O cadastro de usuários está aberto a todos os especialistas interessados. Não é preciso ser um profundo conhecedor de modelagem para utilizar o sistema, pois se utiliza um procedimento padronizado com algoritmos e variáveis ambientais previamente escolhidas. Por outro lado, é importante que o usuário tenha um bom conhecimento sobre a taxonomia, a nomenclatura e a distribuição geográfica das espécies em questão.


Para participar, entre em contato pelo email acima, informando nome, instituição e grupo(s) taxonômico(s) que deseja monitorar.


http://inct.florabrasil.net/


Saiba mais!
  • Biogeografia da Flora e Fungos do Brasil
  • INCT-Herbário Virtual da Flora e dos Fungos
  • EUBrazilOpenBio
  • Modelagem de nicho ecológico em geral :: Peterson A.T., Soberón, J., Pearson, R.G., Anderson, R.P., Martínez-Meyer, H., Nakamura, M., Araújo, M.B., 2011. Ecological Niches and Geographical Distributions. Princeton University Press, Princeton.
  • GARP Best Subsets :: Anderson R.P., Lew, D., Peterson, A.T., 2003. Evaluating predictive models of species’ distributions: criteria for selecting optimal models. Ecological Modelling, 162: 211–232.
  • Distância Mahalanobis :: Farber, O., Kadmon, R., 2003. Assessment of alternative approaches for bioclimatic modeling with special emphasis on the Mahalanobis distance. Ecological Modelling, 160: 115–130.
  • ENFA :: Hirzel, A.H., Hausser, J., Chessel, D., Perrin, N., 2002. Ecological-niche factor analysis: How to compute habitat-suitability maps without absence data? Ecology, 83 (7): 2027–2036.
  • Maxent :: Phillips, S.J., Anderson, R.P., Schapire, R.E., 2006. Maximum entropy modelling of species geographic distributions. Ecological Modelling, 190: 231–259.
  • SVM one-class :: Schölkopf, B., Platt, J., Shawe-Taylor, J., Smola, A.J., Williamson, R.C., 2001. Estimating the support of a high-dimensional distribution. Neural Computation, 13: 1443-1471.

29 de out. de 2013

Brasil e União Européia se unem para combater a perda de biodiversidade

2020 representa um marco importante para alcançar as metas internacionais para a conservação da biodiversidade. O objetivo da União Européia é "deter a perda de biodiversidade e serviços ecossistêmicos na UE até 2020 e restaurá-los na medida do possível, intensificando a contribuição da UE para evitar a perda da biodiversidade global".

Por Stephanie Parker, Trust-IT Services Ltd. *

Atualmente as e-infraestruturas se tornaram fundamentais para as áreas de pesquisa e inovação tecnológica em geral. Elas viabilizam a estreita colaboração entre pesquisadores dos mais diversos países, provendo acesso a um volume de informações científicas sem precedente. O programa Horizon 2020 norteará o próximo ciclo de financiamentos da Comissão Européia; é uma iniciativa que visa facilitar o acesso de pesquisadores de um amplo espectro de disciplinas a ferramentas digitais por meio do desenvolvimento e utilização de e-infraestruturas. Projetos financiados dentro do Horizon 2020 têm como meta principal enfrentar os grandes desafios da sociedade do século 21, como, por exemplo, as questões complexas ligadas a perda de biodiversidade.

O projeto EUBrazilOpenBio é um passo importante na criação de estratégias eficazes para enfrentar desafios associados a perda da biodiversidade no Brasil e Europa através do uso de dados compartilhados e da infraestrutura de computação em nuvem. O projeto é focado no uso compartilhado de recursos já existentes em diversos países, de maneira a agregar infraestruturas desenvolvidas em outros projetos, maximizando tempo e investimentos. Ao promover o conceito de acesso livre e aberto e a integração de sistemas, o EUBrazilOpenBio demonstrou que o financiamento de pequena escala permite avanços significativos na integração de e-infraestruturas, beneficiando-se de investimentos prévios realizados no Brasil e Europa.

De acordo com Wouter Los, coordenador do projeto LifeWatch, um legado importante do projeto EUBrazilOpenBio foi o desenvolvimento de tecnologias amigáveis (user-friendly) para apoiar a cooperação internacional. "O EUBrazilOpenBio abriu novos caminhos para a integração de comunidades levando em conta processos tecnológicos e sociológicos". Los ainda ressalta que “o projeto servirá como exemplo para orientar futuras iniciativas de apoio à investigação colaborativa sobre biodiversidade. A criação de novos modelos de cooperação sustentável para o desenvolvimento de sistemas distribuídos, bem como para fomentar novas interações com parceiros públicos e privados, é fundamental nesta nova era de pesquisa”.

Visando orientar ações futuras, o consórcio EUBrazilOpenBio elaborou um plano de ação, intitulado "Uma visão para acelerar a cooperação entre o Brasil e a Europa, reforçando os laços com as comunidades de pesquisa e negócios". A ideia é impulsionar novas abordagens multidisciplinares para a biodiversidade, incluindo instituições de pesquisa com programas de pós-graduação reconhecidos internacionalmente e o uso de infraestruturas compartilhadas. O plano também identifica oportunidades para as pequenas e médias empresas envolvidas com serviços de computação em nuvem, incluindo a criação de serviços de agregação de valor em torno de dados de acesso livre e aberto.

O objetivo final do projeto foi demonstrar que as abordagens novas e criativas para a descoberta científica tornarão possível dominar os principais desafios técnicos relacionados ao compartilhamento e uso de dados sobre biodiversidade. O Brasil e a Europa têm muito a contribuir para o aprimoramento da infraestrutura de dados e de serviços web. Ao agregar a diversidade de talentos que existe na área de informática a todas as outras áreas de pesquisa em biodiversidade, a cooperação internacional pode tornar a pesquisa colaborativa mais eficiente, mais aberta e multidisciplinar.

*Publicado originalmente em inglês no dia 23 de outubro de 2013.

Saiba mais!



[tradução atualizada em 29.10 às 14:12]

14 de out. de 2013

Herbários contribuem para o desenvolvimento da e-taxonomia no Brasil

Provedores de dados do INCT-Herbário Virtual da Flora e dos Fungos compartilham imagens por meio da rede speciesLink e contribuem para a modernização da taxonomia online.

(English version)


Com o crescimento da rede INCT-HerbárioVirtual da Flora e dos Fungos, destaca-se cada vez mais o trabalho dos mais de 80 herbários que estão compartilhando seus dados de maneira livre e aberta na internet, viabilizando inúmeros trabalhos de pesquisa científica e contribuindo para o ensino da taxonomia nos cursos de graduação e pós-graduação do país. Para destacar a importância do compartilhamento de dados e de conhecimento apresentamos dois herbários que diferem, sobretudo, em idade e tamanho do acervo: o herbário do Jardim Botânico de Nova Iorque (NYBG), cujos dados do acervo referentes a coletas realizadas no Brasil estão sendo repatriados desde 2006, e o Herbário da Universidade de Tocantins (HUTO), há um ano integrando seus dados na rede speciesLink. O uso desses dois herbários como exemplo procura enfatizar a importância de cada um dos herbários participantes da rede, grande ou pequeno, com abrangência geográfica e/ou taxonômica grande ou restrita.

Evolução da entrada de imagens na rede speciesLink para NYBG e HUTO, incluindo o espaço em disco necessário para armazenar os dados.

Pequenos e grandes herbários
As amostras coletadas no Brasil e depositadas no herbário do Jardim Botânico de Nova Iorque (NYBG) representam o maior acervo de imagens de exsicatas disponibilizadas online da rede speciesLink  – mais de 120 mil – compartilhando também 330 mil registros textuais, dos quais cerca de 90% foram georreferenciados pela coleção. O acervo possui mais de 22 mil espécies e mais de 10 mil tipos. São dados de coletas realizadas desde 1768 em todos os 26 estados brasileiros e no Distrito Federal.

Por sua vez, o herbário HUTO da Fundação Universidade do Tocantins (UNITINS), criado em 2005, possui um acervo de cerca de oito mil exsicatas, sendo que os dados textuais de um pouco mais de três mil e quinhentas estão online. Cerca de 65% dos registros foram georreferenciados pela coleção e 95% são de coletas realizadas no próprio estado de Tocantins, principalmente a partir de 2004. O acervo online possui 829 espécies, muitas delas associadas às cerca de duas mil imagens disponibilizadas em alta resolução.


Infraestrutura física e equipe dos herbários NYBG e HUTO.


Perspectivas de desenvolvimento da e-taxonomia
Atualmente, 19 herbários nacionais e 2 do exterior (Jardim Botânico de Nova Iorque e o Museu Nacional de História Natural de Paris - coleção de Saint-Hilaire) estão escaneando ou fotografando seus respectivos acervos para disponibilizar mais de 250 mil imagens associadas aos dados textuais na rede speciesLink. O serviço Exsiccatae, gerenciador das imagens da rede speciesLink, oferece a possibilidade de produzir catálogos ou de comparar as imagens a partir do resultado de busca. Essas ferramentas têm possibilitado novas determinações por especialistas via internet que podem enviar seus comentários referentes à imagem avaliada diretamente para o curador, contribuindo para melhorar a qualidade dos dados e para o desenvolvimento da e-taxonomia no Brasil.

É importante ressaltar que a força do INCT-Herbário Virtual da Flora e dos Fungos está na participação de cada instituição disposta a compartilhar seus dados e conhecimento de forma integrada. Embora os herbários NYBG e HUTO sejam diferentes no tamanho de acervo, em infraestrutura física e na idade, ambos representam exemplos igualmente importantes para a infraestrutura pública de dados sobre a biodiversidade brasileira. Como estes, existem inúmeros outros exemplos de auxílio mútuo e de troca de experiências, o que vem efetivamente contribuindo para a modernização das pesquisas em biodiversidade no Brasil.

  
Saiba mais!

Texto - Dora Canhos e Sidnei de Souza
Fotos - Acervo dos herbários
English version - Herbaria contribute to the development of e-taxonomy in Brazil

10 de out. de 2013

Herbários de Recife discutem melhoria na qualidade dos dados

Visita promovida pelo CRIA e INCT-Herbário Virtual da Flora e dos Fungos dá continuidade ao trabalho de identificar os principais avanços e dificuldades dos herbários nacionais, discutindo a qualidade dos dados disponibilizados.

Da esquerda para direita: Gabriel Mendes (UFP), Alcina Viana (IPA), Cheysa Figueredo (IPA), Angela Miranda (HST), Marlene Barbosa (UFP), Maria Elizabeth (PEUFR), Rita Pereira (IPA) e Flávia Pezzini (CRIA/INCT-HVFF).

De 30 de setembro a 4 de outubro, a equipe do Centro de Referência em Informação Ambiental (CRIA) e do INCT-Herbário Virtual da Flora e dos Fungos (INCT-HVFF) reuniu em Recife curadores, técnicos e bolsistas dos herbários da região para discutir a melhoria da qualidade dos dados compartilhados através da rede speciesLink. Participaram cinco herbários de Recife que fazem parte da rede do INCT-HVFF: URM (Herbário Pe. Camille Torrand), UFP (Herbário Geraldo Mariz), IPA (Herbário Dárdano de Andrade Lima), HST (Herbário Sérgio Tavares) e PEUFR (Herbário Professor Vasconcelos Sobrinho). O URM representa a maior coleção de fungos herborizados na América Latina, com 84.500 registros, dos quais mais de 90% estão online. O UFP possui 58.540 registros de plantas principalmente do Nordeste, dos quais cerca de 60% estão online. O HST conta com um acervo de 19.681 registros, 100% online e 680 registros com imagens associadas. O PEUFR possui um acervo de 51.473 registros, dos quais cerca de 35% estão online. O IPA é a mais antiga fonte de informação sobre a flora do Nordeste e abriga cerca de 81.000 registros, dos quais cerca de 80% estão online.

Análise conjunta da ferramenta dataCleaning para dignosticar erros e direcionar a correção.

A visita dá continuidade ao trabalho de identificar os principais avanços e dificuldades de cada herbário, discutindo a padronização e qualidade dos dados ao realizar uma análise conjunta do relatório dataCleaning. Esse contato próximo com os curadores, técnicos e bolsistas contribui muito para os familiarizar mais com a ferramenta e fazer uma análise comparativa dos erros de cada herbário. A ferramenta dataCleaning procura evidenciar os dados que podem conter erros, por exemplo, em relação às informações gerenciais de curadoria (número de tombo, registros repetidos), aos dados taxonômicos (erros de grafia, diferentes nomes de autor para a mesma espécie), à data (ano de identificação anterior ao da coleta, ano de coleta maior do que a última atualização) ou aos dados de georeferenciamento (ausência de sinal em latitudes ou longitudes negativas, coordenadas que caem no mar).

Herbário UFP, que abriga registros de plantas principalmente da região Nordeste.

Todos os herbários participantes frequentemente atualizam os dados enviados ao speciesLink e estão fortemente empenhados em sua correção. Por exemplo, para todos eles não há mais registros suspeitos relacionados a erros de grafia para Famílias e Gêneros. Além desse diagnóstico, os participantes levantaram questões importantes como a atualização dos nomes de estados e municípios (por exemplo, devemos atualizar o estado para as coletas feitas em Tocantins antes da sua criação?) e a padronização dos nomes dos coletores e determinadores. Sugestões para essas questões podem ser consultadas no repositório de documentos do speciesLink [disponível aqui]. Esses documentos foram desenvolvidos pela equipe do CRIA após a Conferência Internacional: o INCT Herbário Virtual da Flora e dos Fungos e e-infraestruturas para Biodiversidade, ocorrida em setembro de 2012 na qual todos os herbários estavam presentes.

Leonor Costa Maia, coordenadora do INCT-HVFF e curadora do URM, e João Batista de Oliveira, biólogo do URM.

Outro ponto que merece atenção está relacionado a um dos formatos utilizado pelo BRAHMS, adotado por algumas coleções participantes, para inserir coordenadas geográficas. Existe um artifício criado pelos programadores para anotar informações sobre as coordenadas geográficas que pode gerar confusão. O BRAHMS permite a entrada de dados no formato de GMS (graus, minutos e segundos) por meio de um formato intermediário que se assemelha ao formato de GD (graus decimais), mas que o BRAHMS interpreta como formato GMS. Isso reduz a necessidade de incluir símbolos que costumam gerar erros, mas se não for devidamente informado pode gerar uma interpretação errônea.


Para ver mais fotos das visitas aos herbários, clique aqui. 

Saiba mais!

Texto e Fotos - Ricardo Braga Neto e Flávia Pezzini