4 de nov de 2013

Biogeografia da Flora e dos Fungos do Brasil

Compreender melhor a distribuição geográfica de espécies é fundamental para promover a conservação da biodiversidade. Visando ampliar o conhecimento sobre a biogeografia de plantas e fungos do Brasil, foi desenvolvido um sistema para modelar a distribuição potencial das espécies, contando com a participação ativa de especialistas.

http://biogeo.inct.florabrasil.net/proc/89
Projeção de consenso entre os modelos de nicho ecológico para Passiflora mucronata (Bernacci & Giovanni 2013), indicando a área potencial de distribuição da espécie no Brasil. Prancha disponível no Herbario Virtual Flora Brasiliensis.

Visando expandir o conhecimento sobre a biogeografia das espécies de plantas e fungos do Brasil, o INCT-Herbário Virtual da Flora e dos Fungos (INCT-HVFF) desenvolveu em parceria com o Centro de Referência em Informação Ambiental (CRIA) um sistema para modelar a distribuição potencial de espécies, contando com a participação ativa de especialistas. O sistema, Biogeografia da Flora e dos Fungos do Brasil (Biogeo), foi desenvolvido no âmbito do Sistema Nacional de Pesquisa em Biodiversidade (SISBIOTA Brasil), utilizando a rede speciesLink como base de dados da ocorrência das espécies.

O sistema visa contribuir para ampliar a compreensão das necessidades ambientais das espécies, investigar diversas questões envolvendo pesquisa e conservação, indicar espécies com maior carência de dados e orientar novas coletas. O sistema abre a perspectiva para as comunidades botânica e micológica construírem um banco de dados sobre plantas e fungos que no futuro poderá conter pelo menos um modelo de distribuição potencial para cada espécie.

Parkia pendula registrada no sul da Bahia por Fábio Coppola (Flickr). Conhecida na região como Juerana, é uma árvore emergente que possui uma distribuição composta de áreas na costa do Nordeste e áreas na Amazônia.

Como funciona
A interface do sistema possui uma seção aberta, onde todos os modelos publicados podem ser visualizados, e uma seção reservada aos supervisores cadastrados, os quais são responsáveis pelo processo de modelagem das espécies. Atualmente o sistema tem 55 supervisores cadastrados e cerca de 700 espécies com modelos gerados, incluindo angiospermas, samambaias e fungos macroscópicos. Todos esses modelos podem ser vistos a partir do menu de navegação na barra superior (clicando em Taxonomia pode-se visualizar as opções disponíveis, realçadas com fundo branco) ou buscados pelo nome científico no canto superior direito.

http://biogeo.inct.florabrasil.net/proc/4582
Modelos gerados para Pycnoporus sanguineus, um fungo amplamente distribuído em regiões tropicais e subtropicais do mundo (Braga-Neto 2013). A) Corpo de frutificação: produz os esporos que são dispersos pelo vento. B) Pontos de ocorrência: Dos 594 registros disponíveis na rede speciesLink, apenas 7,9% foram incluídos na modelagem. C) Modelo de consenso: Ainda que o número de pontos seja suficiente para incluir todos os algoritmos, o modelo pode ser considerado preliminar porque existem grandes lacunas de registros com coordenadas geográficas, influenciando a qualidade final do modelo. Crédito da foto: Damon Tighe (Flickriver).

O Biogeo busca padronizar a geração de modelos e compartilhar os resultados de forma livre e aberta, permitindo que os experimentos possam ser facilmente reproduzidos e verificados pelos usuários. O sistema permite que vários modelos sejam gerados ao longo do tempo para a mesma espécie, porém somente um deles é exibido como referência. O modelo de referência é sempre o último modelo aprovado para a espécie, pois se espera que cada novo modelo seja melhor que os anteriores. Os modelos gerados ficam disponíveis para serem avaliados pelos especialistas, que podem aprovar ou descartar o resultado. O sistema utiliza dados de ocorrência de espécies disponíveis na rede speciesLink, a Lista de Espécies da Flora do Brasil 2012 como base taxonômica e variáveis ambientais bioclimáticas do WorldClim que afetam a distribuição de grande parte das espécies vegetais:
  • Altitude (modelo digital de elevação)
  • Variação média de temperatura no dia 
  • Temperatura máxima no mês mais quente 
  • Temperatura mínima no mês mais frio 
  • Precipitação no trimestre mais úmido 
  • Precipitação no trimestre mais seco 
  • Precipitação no trimestre mais quente
  • Precipitação no trimestre mais frio
O funcionamento do Biogeo é baseado na ferramenta openModeller, podendo utilizar até 5 algoritmos de modelagem, dependendo do número de pontos de ocorrência. Para espécies com menos de 5 pontos gera-se apenas um modelo de dissimilaridade ambiental através do cálculo da distância euclideana ao ponto de ocorrência mais próximo. De 5 a 9 pontos gera-se um modelo com o algoritmo Maxent; de 10 a 19 pontos são gerados dois modelos, um com o Maxent e outro com o GARP Best Subsets (GARP BS). A partir de 20 pontos são utilizados 5 algoritmos: Maxent, GARP BS, Distância Mahalanobis, ENFA e Máquina Vetores de Suporte de classe única (SVM).

A estratégia de modelagem de nicho ecológico depende do número de pontos de ocorrência disponíveis para cada espécie. Com menos de 5 pontos gera-se um modelo inicial com o objetivo de guiar novas coletas. Entre 5 e 19 pontos os modelos ainda são considerados exploratórios, mas servem como uma estimativa preliminar do nicho da espécie, sendo gerados com um ou dois algoritmos. Modelos gerados a partir de 20 pontos permitem a inclusão de todos os algoritmos, tendendo a ser mais robustos.

O trabalho é realizado separadamente para cada espécie e basicamente envolve: 1) a seleção dos nomes a serem utilizados na busca de registros de ocorrência; 2) a seleção dos registros de ocorrência a serem utilizados no procedimento de modelagem; e 3) a avaliação do modelo gerado. Embora a maior parte dos modelos originais sejam contínuos (i.e., preveem a ocorrência potencial da espécie em uma gama de valores entre 0 e 1), os modelos são também transformados em modelos binários (i.e., prevendo a ocorrência potencial da espécie em valores iguais a 0 ou 1) com base em um limiar de corte, visando facilitar a geração de um modelo de consenso que exibe apenas os locais onde há concordância entre os algoritmos utilizados. Para mostrar o funcionamento escolhemos a espécie Parkia pendula (Willd.) Benth. ex Walp. como exemplo.

http://fsi.cria.org.br/fsicache/fsi1?type=image&width=1600&height=2400&rect=0,0,1,1&profile=fsi&source=herbaria/NY/NY01190430_01.tif&
Exsicata de Parkia pendula coletada em 1979 na Estação Experimental de Silvicultura Tropical, entre Manaus e Boa Vista. A amostra está depositada no herbário do Jardim Botânico de Nova Iorque (NY 1190430), mas não foi incluída na geração dos modelos de nicho ecológico porque não possui coordenadas geográficas do local de coleta com boa precisão.


Explorando o Biogeo
O primeiro passo para gerar os modelos de Parkia pendula envolveu a seleção dos nomes a serem utilizados na busca de registros de ocorrência, considerando a possibilidade de haver sinônimos na base de dados da Lista de Espécies da Flora do Brasil ou no Tropicos. Em seguida o supervisor selecionou 50 pontos de ocorrência com a ajuda de filtros automáticos de qualidade que visam evitar a inclusão de registros com problemas de georreferenciamento ou identificação. Os pontos de ocorrência selecionados provêm de 18 herbários integrados à rede speciesLink.

Registros de Parkia pendula utilizados no procedimento de modelagem (Lima 2013).

Em seguida, os modelos foram projetados no espaço geográfico para visualização. Como existem mais de 20 pontos disponíveis para esta espécie, foram gerados modelos com base nos 5 algoritmos. No momento, a geração e a projeção dos modelos estão restritas ao território brasileiro porque a ampliação da cobertura geográfica depende de uma série de alterações não triviais, como conhecer os datums utilizados em outros países, ampliar a base de dados de estados e municípios, além de outros detalhes.

Projeções dos modelos de nicho ecológico gerados para Parkia pendula (Lima 2013). A) Extensão geográfica abordada nos modelos. B) Pontos de ocorrência. C) SVM one-class. D) Maxent original. E) Maxent binário. F) Distância Mahalanobis original. G) Distância Mahalanobis binário. H) ENFA original. I) ENFA binário. J) GARP BS original. K) GARP BS binário. L) Modelo de consenso. As áreas em vermelho em C, E, G, I e K indicam modelos binários (presença ou ausência). Os modelos D, F, H e J são contínuos e as cores quentes indicam maior probabilidade de ocorrência. As áreas em vermelho no modelo de consenso L indicam concordância entre os 5 algoritmos, em laranja 4 e em amarelo 3. 


Como avaliar os modelos gerados?
Os modelos gerados NÃO representam a distribuição real da espécie, mas sim a distribuição potencial em áreas ambientalmente adequadas à espécie de acordo com os pontos e variáveis ambientais utilizados no procedimento de modelagem. Vários motivos históricos podem ter contribuído para que a espécie não tenha ocupado todas as áreas potencialmente adequadas. Assim, a projeção do modelo é frequentemente maior que a distribuição real. O procedimento de modelagem visa gerar resultados melhores e mais precisos ao longo do tempo à medida que mais registros de ocorrência são disponibilizados. Para avaliar a qualidade dos modelos existem algumas estatísticas, como omissão interna e omissão média. Modelos com pelo menos 20 pontos de ocorrência podem ser avaliados também por meio da AUC (Area under the curve). Os modelos aprovados incluem um perfil ambiental disponível na página de detalhes do procedimento de modelagem. Procedimentos com um mínimo de 10 pontos incluem histogramas das variáveis ambientais com base nos pontos de ocorrência selecionados para a modelagem.

http://biogeo.inct.florabrasil.net/proc/3449
Condições ambientais nos pontos de ocorrência indicando para cada variável a amplitude de variação e distribuição de frequência dos valores.


Como participar?
O cadastro de usuários está aberto a todos os especialistas interessados. Não é preciso ser um profundo conhecedor de modelagem para utilizar o sistema, pois se utiliza um procedimento padronizado com algoritmos e variáveis ambientais previamente escolhidas. Por outro lado, é importante que o usuário tenha um bom conhecimento sobre a taxonomia, a nomenclatura e a distribuição geográfica das espécies em questão.


Para participar, entre em contato pelo email acima, informando nome, instituição e grupo(s) taxonômico(s) que deseja monitorar.


http://inct.florabrasil.net/


Saiba mais!
  • Biogeografia da Flora e Fungos do Brasil
  • INCT-Herbário Virtual da Flora e dos Fungos
  • EUBrazilOpenBio
  • Modelagem de nicho ecológico em geral :: Peterson A.T., Soberón, J., Pearson, R.G., Anderson, R.P., Martínez-Meyer, H., Nakamura, M., Araújo, M.B., 2011. Ecological Niches and Geographical Distributions. Princeton University Press, Princeton.
  • GARP Best Subsets :: Anderson R.P., Lew, D., Peterson, A.T., 2003. Evaluating predictive models of species’ distributions: criteria for selecting optimal models. Ecological Modelling, 162: 211–232.
  • Distância Mahalanobis :: Farber, O., Kadmon, R., 2003. Assessment of alternative approaches for bioclimatic modeling with special emphasis on the Mahalanobis distance. Ecological Modelling, 160: 115–130.
  • ENFA :: Hirzel, A.H., Hausser, J., Chessel, D., Perrin, N., 2002. Ecological-niche factor analysis: How to compute habitat-suitability maps without absence data? Ecology, 83 (7): 2027–2036.
  • Maxent :: Phillips, S.J., Anderson, R.P., Schapire, R.E., 2006. Maximum entropy modelling of species geographic distributions. Ecological Modelling, 190: 231–259.
  • SVM one-class :: Schölkopf, B., Platt, J., Shawe-Taylor, J., Smola, A.J., Williamson, R.C., 2001. Estimating the support of a high-dimensional distribution. Neural Computation, 13: 1443-1471.

Nenhum comentário:

Postar um comentário