Mostrando postagens com marcador qualidade dos dados. Mostrar todas as postagens
Mostrando postagens com marcador qualidade dos dados. Mostrar todas as postagens

20 de mar. de 2014

Herbário FLOR recebe visita para discutir a qualidade dos dados

A visita da equipe do INCT-HVFF, em parceria com o CRIA, teve como objetivo incentivar curadores, técnicos, pesquisadores e alunos a prezar pela qualidade dos dados dos espécimes. Particularmente, a visita visou aprofundar a participação dos micólogos e discutir a inclusão de imagens dos espécimes de fungos na rede speciesLink.

Professores e alunos do Micolab na UFSC. O aumento do número de alunos reflete maior interesse nos fungos, em grande parte motivado pela presença de jovens pesquisadores.

O Herbário FLOR da Universidade Federal de Santa Catarina (UFSC) possui uma coleção online com cerca de 42.000 registros de espécimes de plantas vasculares, 6.000 de fungos e 1.000 de algas. O acervo do herbário está voltado especialmente para a flora e micota da região Sul do Brasil. O herbário faz parte da rede INCT Herbário Virtual da Flora e dos Fungos desde julho de 2011 e vem contribuindo com um acréscimo de quase 10.000 registros por ano. A maior parte da coleção é de plantas, mas o número de espécimes de fungos tem grande potencial de aumentar com a participação de dezenas de alunos de graduação e de pós-graduação do Laboratório de Micologia (Micolab), liderado pelos Profs. Maria Alice Neves e Elisandro Ricardo Drechsler-Santos.

Histórico da evolução do número total de registros online e registros georreferenciados do herbário FLOR.
 
Zelando pela qualidade dos dados
O herbário FLOR tem uma bióloga contratada que é responsável pelo banco de dados, exercendo um papel chave para a qualidade das informações disponibilizadas. De uma forma geral, os dados taxonômicos estão bem cuidados, mas uma grande proporção dos registros não possui coordenadas geográficas originais, ou seja, informadas pela própria coleção. Isso se deve em parte à carência de informações nas coletas mais antigas, mas também à falta de uma cobrança sistemática por parte dos curadores e técnicos.

Silvia Venturi, bióloga responsável pelo banco de dados de FLOR, e Eduardo Michelena, seu estagiário.

Durante a visita, foram discutidas as melhores práticas para realizar o georreferenciamento. O formato de graus decimais foi sugerido como formato padrão, pois reduz muito a chance de inclusão de erros. Além disso, algumas dicas sobre a utilização de aparelhos de GPS em campo foram passadas, com ênfase para a configuração prévia do formato da coordenada para graus decimais e do datum para WGS84. Para coletas antigas ou recentes sem coordenadas é possível fazer o georreferenciamento retrospectivo, um conjunto de técnicas que atribui uma coordenada geográfica com base nas informações escritas sobre a localidade. Softwares populares, como o Google Earth, são adequados à tarefa, pois conciliam uma interface amigável dos mapas de satélite com um banco de dados com nomes de localidades que funcionam bem para a maior parte do planeta. Outra ferramenta de acesso aberto é o GeoLoc, que fornece coordenadas geográficas para um determinado município ou para o nome completo ou parcial da localidade. Também bastante útil é o conversor, ferramenta que permite a conversão de diferentes tipos de representação de coordenadas geográficas e datums disponíveis no Brasil. Ambas permitem que a conversão de coordenadas ou a busca por localidades seja feita individualmente ou em lotes.

Interface do geoLoc (http://splink.cria.org.br/geoloc).

Panorama da coleção de fungos
Atualmente não existe uma separação estrutural na rede speciesLink entre as coleções de fungos e plantas. Porém, devido ao preenchimento completo das informações do campo ‘Reino’ para todos os espécimes de fungos é possível analisar a coleção de fungos de FLOR de maneira independente. Hoje existem 5.875 espécimes de fungos com dados online, sendo o filo Basidiomycota o mais representado, com 4.911 amostras, seguido de Ascomycota, com 443 amostras.

Caixas com espécimes de fungos macroscópicos depositados no herbário FLOR. Atualmente existem cerca de 6.000 registros de fungos online, mas nenhum possui imagens associadas.

O acervo tem um viés mais voltado aos fungos decompositores da madeira, decorrente da contribuição da Profa. Clarice Loguércio Leite, que durante anos lecionou micologia na UFSC com foco nesse grupo de fungos, contribuindo para a formação de micólogos que hoje estão formando a nova geração. As principais famílias de fungos representadas em FLOR são Polyporaceae (1.513 registros), Hymenochaetaceae (661), Ganodermataceae (340) e Agaricaceae (244), mas o acervo está sendo diversificado com o fortalecimento do Micolab.
 
A contratação de jovens professores tem permitido a participação de diversos alunos em pesquisas com fungos.

Os espécimes de fungos depositados no herbário FLOR foram coletados principalmente no Brasil. A distribuição geográfica das coletas está concentrada principalmente na região Sul, com maior densidade no estado de Santa Catarina, mas o herbário FLOR também abriga coletas importantes feitas na Amazônia e no Nordeste.

Distribuição das localidades dos espécimes de fungos depositados em FLOR e presentes na rede speciesLink. Em azul, coordenadas georreferenciadas pelo município; em vermelho, coordenadas originais informadas pela coleção.

O dinamismo atual do Micolab é refletido pelo grande número de alunos participantes e pela diversidade de grupos de fungos estudados, mostrando que a micologia passa por um importante momento de desenvolvimento que deve contribuir para aumentar nosso conhecimento sobre a diversidade de fungos no Brasil. Contudo, alguns aprimoramentos do sistema speciesLink podem ajudar a tornar a ferramenta ainda mais útil para a comunidade científica. Uma delas é a associação das imagens dos espécimes aos dados textuais.

O Micolab conta com uma estrutura bastante completa que potencializa a formação dos jovens micólogos.

Imagens para espécimes de fungos
Um dos objetivos da visita foi levantar as demandas dos micólogos em relação à inclusão de imagens dos espécimes de fungos no INCT-Herbário Virtual, via rede speciesLink. Durante a visita foram discutidas questões relacionadas à padronização e operacionalização dessa demanda. Atualmente o INCT-Herbário Virtual não possui imagens de espécimes de fungos do herbário FLOR, mas os pesquisadores e alunos fazem uso cotidiano de imagens macro e microscópicas para auxiliar a identificação das espécies. Assim, há um interesse natural em associar as imagens aos registros textuais.

Alunos trabalhando no Micolab. Associar imagens dos espécimes de fungos vai ajudar a tornar acessíveis informações essenciais para a identificação das espécies.

Foram discutidas as principais categorias de imagens que usualmente estão associadas aos espécimes e houve uma dinâmica para informar quais campos são essenciais para cada grupo de fungos. Outros pontos importantes envolvem a questão das escalas, legendas e créditos das imagens. Essas informações estão sendo compiladas e transmitidas à equipe do CRIA, responsável pelo desenvolvimento do sistema.

Maria Alice Neves, docente da UFSC, que está ajudando a formar novos micólogos no Brasil.

Embora os fungos sejam menos conhecidos do que plantas e animais, o número de alunos e a estrutura existente no Micolab prometem contribuir para a geração de conhecimento sobre a diversidade e distribuição das espécies de fungos que ocorrem no Brasil, ajudando a reduzir essa falta de conhecimento histórica. A rede speciesLink, que mantém e disponibiliza os dados dos herbários vinculados ao INCT-Herbário Virtual, possui uma estrutura bastante completa, mas a qualidade dos dados é determinante para o tipo de uso que essas informações podem ter. A visita favoreceu não apenas a realização do trabalho proposto, mas o estreitamento de vínculos que tenderão a aumentar o comprometimento dos envolvidos em promover a melhoria da qualidade dos dados sobre fungos, bem como o aprimoramento do sistema, visando ampliar sua utilidade para a comunidade científica.


Saiba mais!

Créditos
Texto e fotos - Ricardo Braga-Neto
*atualizado em 22.03.2014

6 de fev. de 2014

Apostila "Curadoria de dados de herbário com ênfase no software BRAHMS" disponível para download

Direcionada a curadores, técnicos e estagiários de herbários, a apostila tem foco no software BRAHMS, mas as recomendações apresentadas são importantes qualquer que seja o programa utilizado pela coleção. 


A apostila foi elabora inicialmente como material didático do curso: “Curadoria de dados de herbário com ênfase no software BRAHMS" oferecido nos dias 09 e 10 de novembro de 2013, anterior ao 64o Congresso Nacional de Botânica realizado em Belo Horizonte. O curso teve como objetivo treinar curadores, técnicos e estagiários de herbários em técnicas de curadoria de dados, visando melhorar a qualidade da informação disponibilizada na rede speciesLink. O software BRAHMS foi escolhido por ser o software mais usado pelos herbários nacionais participantes do INCT Herbário Virtual da Flora e dos Fungos (47%) no manejo de seus dados. No entanto, a apostila contém informações úteis independentemente do software utilizado pela coleção.

Participantes do curso Curadoria de dados de herbário com ênfase no software BRAHMS no campus da UFMG em Belo Horizonte.

A apostila procura apresentar e esclarecer as principais dúvidas de curadores, técnicos e bolsistas dos herbários participantes do INCT-HVFF e está em constante atualização, a medida que surgem novas questões. Participaram dessa iniciativa membros da equipe do Herbário da Universidade de Brasília (UB), do CRIA e do INCT Herbário Virtual da Flora e dos Fungos (HVFF).

Para baixar a apostila acesse: http://splink.cria.org.br/docs/Apostila_curso_curadoria_2013v01.pdf

Saiba mais!

23 de jan. de 2014

Novidades na ferramenta Duplicata do dataCleaning

Novos filtros e agrupamentos dos dados facilitam a identificação de determinações distintas para duplicatas de plantas em diferentes herbários. A ferramenta Duplicata visa auxiliar curadores e técnicos de herbários a identificar e corrigir erros e a atualizar e completar os dados.


Exsicatas da mesma coleta depositadas em herbários diferentes podem ter identificações distintas. A exsicata depositada no herbário FLOR (à esquerda) representa a coleta número 10806 de J. Mattos realizada em 15 de dezembro de 1962 em Conceição da Barra, Espírito Santo, Brasil. A exsicata do mesmo material depositada em SP (à direita) foi identificada como Eugenia hirta O.Berg. por M. Sobral em setembro de 1991, mas a duplicata de FLOR permanece sem atualização da identificação inicial.
 
Durante visitas promovidas pelo CRIA e INCT-Herbário Virtual da Flora e dos Fungos para discutir a qualidade dos dados disponibilizados online, curadores e técnicos dos herbários sugeriram algumas melhorias que foram implementadas recentemente. Essas melhorias incluem novos filtros e formas de visualização do relatório, e, quando disponível, a apresentação da imagem da exsicata. Registros "suspeitos" detectados pela ferramenta Duplicata são aqueles que possuem o mesmo nome, número de coletor e data de coleta, mas informações distintas nos campos "gênero + espécie + subespécie".

Um dos grandes problemas na identificação de duplicatas nos diferentes herbários através de um aplicativo era a falta de padronização do nome do coletor. A ferramenta agora reconhece variações na ordem da escrita do nome e iniciais dos coletores. Por exemplo, D. Alvarenga é reconhecido como sendo o mesmo que Alvarenga, D.. O sistema também reconhece como sendo o mesmo o coletor isolado ou o coletor principal quando registrado juntamente com os coletores secundários. Por exemplo, A.A. Ribeiro-filho é considerado isoladamente ou quando associado com outros coletores, como no caso A.A. Ribeiro-filho, L.C. Soares. 


A tabela apresentada pode ser ordenada por nome do coletor, família ou gênero, facilitando o trabalho do curador que quiser analisar os dados por família, por exemplo. Cada linha é clicável e permite navegação dinâmica. A tabela apresenta também o nome do determinador e data de determinação, assim como novos filtros como família ou gênero indeterminados para que seja possível rapidamente comparar esses registros com duplicatas de outros herbários participantes da rede speciesLink.

Esperamos com isso facilitar o trabalho de atualização da nomenclatura taxonômica dos acervos. Com o uso da ferramenta, herbários que não possuem especialistas de determinados grupos taxonômicos podem se beneficiar do trabalho de identificação do material em outros herbários e, dessa forma, contribuir para a melhora da qualidade dos dados da rede do Herbário Virtual.

 

Saiba mais!

19 de nov. de 2013

Conhecimento digital acessível e prioridades para o inventário de plantas no Brasil

Artigo publicado na revista Diversity and Distributions usa dados primários de biodiversidade disponíveis na internet para avaliar lacunas de conhecimento da flora do Brasil, considerando efeitos geográficos e ambientais sobre os padrões de distribuição.


Estima-se que o Brasil abriga cerca de 20% da diversidade mundial de angiospermas, possuindo a flora mais rica e endêmica dos Neotrópicos. Embora os estudos botânicos tenham iniciado há mais de um século, apenas uma parte do território nacional foi amostrada. Até pouco tempo atrás era inviável fazer uma avaliação quantitativa do esforço de coletas reunindo informações da maior parte dos herbários, pois os dados não estavam disponíveis em uma base consolidada. Entretanto, a integração e a disponibilização aberta desses dados na internet por meio da rede speciesLink tornou possível avaliar a representatividade geográfica, ambiental e taxonômica das coletas no país. A rede speciesLink constitui a base do sistema de informação que alimenta o INCT-Herbário Virtual da Flora e dos Fungos, contribuindo para integrar dados de herbários nacionais e do exterior.

Os resultados foram publicados recentemente na revista Diversity and Distributions por Mariane S. Sousa-Baena, Letícia C. Garcia e A. Townsend Peterson. "O objetivo foi utilizar os dados disponíveis para revelar os espaços geográficos onde estão as maiores lacunas de conhecimento, uma informação que pode ajudar a orientar a realização de novas coletas e também a elaboração de planos para a conservação da flora", explica Mariane.


A distribuição espacial da densidade de coleta de angiospermas indica uma concentração na região costeira (a) e uma tendência à agregação em torno de cidades e estradas (b).


Representatividade das coletas
No estudo, foram utilizados dados de cerca de 1,7 milhões de espécimes distribuídos em 88 herbários (83 do Brasil e 5 do exterior). As informações geográficas provêm de coordenadas originais informadas pela coleção ou derivadas do centróide do município (via aplicativo). Além da projeção bruta dos pontos de coleta, diferentes escalas espaciais foram utilizadas para analisar os padrões, incluindo divisões políticas estaduais, ecorregiões e píxeis com resolução espacial de 1o, 1/2o e 1/10o.

Para avaliar quão representativas são as coletas de angiospermas no Brasil, os autores utilizaram uma medida de completude (completeness) e com base no conhecimento de espécies observadas foi estimado o número esperado de espécies para cada píxel, estado ou ecorregião. Áreas com baixa completude têm maior chance de abrigar novos registros de espécies já descritas ou espécies novas, e portanto devem ser tratadas como prioridade para novos esforços de coleta. No mapa abaixo é possível perceber que poucos locais são bem conhecidos floristicamente, de forma que a maioria possui poucas ou até mesmo nenhuma amostra. Embora o mapa com píxeis mais extensos (1o) indique uma completude do inventário maior no Brasil como um todo, em uma escala mais fina (1/10o) é possível observar que na realidade píxeis bem amostrados estão restritos a alguns locais pontuais, separados por grandes lacunas de conhecimento.

Padrões geográficos da completude dos inventários florísticos no Brasil para diferentes resoluções espaciais. Cores quentes indicam altos valores de completude e frias valores baixos.


Incorporando informações ambientais
O estudo procura aprimorar a visão da distribuição espacial dos registros com informações sobre a variação ambiental, baseadas em informações climáticas, levando em conta a distância geográfica das lacunas de sítios bem conhecidos. Integrando todas estas informações foi possível identificar se as lacunas de amostragem eram climaticamente semelhantes ou distintas, e/ou geograficamente próximas ou distantes de sítios bem conhecidos. A taxa de variação nas condições ambientais é importante, pois áreas relativamente uniformes podem ser caracterizadas floristicamente por amostragens mais esparsas, enquanto áreas com maior variação nas condições ambientais requerem uma amostragem mais intensa. As quatro principais lacunas de amostragem reveladas indica a região da cabeça do cachorro no noroeste da Amazônia, a região da Serra do Tumucumaque no Amapá, uma ampla região no arco do desmatamento entre o Pará e o Mato Grosso, além de uma região de campos a oeste do Rio Grande do Sul.

Representação da variação climática no Brasil para píxeis de 1/2 grau (a), distância geográfica de sítios bem conhecidos (b) e de áreas geograficamente distantes e ambientalmente distintas daquelas de sítios bem conhecidos (c). Cores frias indicam distâncias menores, cores quentes distâncias maiores e píxeis pretos indicam sítios bem conhecidos floristicamente. A sobreposição do mapa 'c' com o mapa de uso da terra permite diferenciar áreas com cobertura natural (escuras) de áreas com forte alteração (claras) em (d), (e) e (f).

Algumas das lacunas identificadas estão localizadas em regiões de intensa pressão de conversão de terras que precisam de ser investigadas antes que desapareçam. A região Sudeste possui apenas pequenos fragmentos florestais isolados, e regiões no sul do Pará sofrem pressões de desmatamento ao longo da rodovia BR-163, onde inclusive existe uma lei (LEI Nº 12.678, DE 25 DE JUNHO DE 2012) que diminuiu e modificou o limite de diversos parques da região por pressões de mineradoras e hidrelétricas. Sem conhecer a flora, é impossível sabermos qual é a perda de espécies que o desmatamento contínuo poderá causar.

Perspectivas
Não existe consenso sobre quantas espécies de plantas existem no Brasil, mas as estimativas variam entre 40 e 50 mil espécies. De acordo com a Lista de Espécies da Flora do Brasil (2013), existem 32.000 espécies de angiospermas reconhecidas para o país. A flora da região Sudeste e Nordeste são melhor conhecidas, pois abriga a maior parte dos institutos de pesquisa e recursos humanos especializados, mas mesmo essas regiões têm importantes lacunas de conhecimento taxonômico quando se considera uma escala mais fina. A Amazônia permanece como a região mais desconhecida: cerca de 40% da área nunca foi amostrada e o conhecimento existente está concentrado em alguns sítios. Entretanto, regiões importantes no estado do Tocantins e o oeste do Mato Grosso também abrigam potencialmente muitas espécies desconhecidas.

O estudo ilustra o potencial de utilização de dados primários da biodiversidade integrados e compartilhados abertamente na internet para a pesquisa científica e para a definição de políticas de conservação no país. Ainda que uma parte dos dados existentes para o Brasil não esteja disponível online (por estarem em fase de digitação ou em herbários que ainda não estão compartilhando seus dados) e que seja necessário trabalhar a qualidade dos dados disponíveis na rede, eles já são um importante subsídio para o planejamento da conservação e para orientar a realização de novas coletas. Dessa forma, as expedições de campo podem se concentrar em áreas prioritárias, maximizando o retorno do investimento nos estudos da biodiversidade da nossa flora.


http://inct.florabrasil.net/


Saiba mais!

29 de out. de 2013

Brasil e União Européia se unem para combater a perda de biodiversidade

2020 representa um marco importante para alcançar as metas internacionais para a conservação da biodiversidade. O objetivo da União Européia é "deter a perda de biodiversidade e serviços ecossistêmicos na UE até 2020 e restaurá-los na medida do possível, intensificando a contribuição da UE para evitar a perda da biodiversidade global".

Por Stephanie Parker, Trust-IT Services Ltd. *

Atualmente as e-infraestruturas se tornaram fundamentais para as áreas de pesquisa e inovação tecnológica em geral. Elas viabilizam a estreita colaboração entre pesquisadores dos mais diversos países, provendo acesso a um volume de informações científicas sem precedente. O programa Horizon 2020 norteará o próximo ciclo de financiamentos da Comissão Européia; é uma iniciativa que visa facilitar o acesso de pesquisadores de um amplo espectro de disciplinas a ferramentas digitais por meio do desenvolvimento e utilização de e-infraestruturas. Projetos financiados dentro do Horizon 2020 têm como meta principal enfrentar os grandes desafios da sociedade do século 21, como, por exemplo, as questões complexas ligadas a perda de biodiversidade.

O projeto EUBrazilOpenBio é um passo importante na criação de estratégias eficazes para enfrentar desafios associados a perda da biodiversidade no Brasil e Europa através do uso de dados compartilhados e da infraestrutura de computação em nuvem. O projeto é focado no uso compartilhado de recursos já existentes em diversos países, de maneira a agregar infraestruturas desenvolvidas em outros projetos, maximizando tempo e investimentos. Ao promover o conceito de acesso livre e aberto e a integração de sistemas, o EUBrazilOpenBio demonstrou que o financiamento de pequena escala permite avanços significativos na integração de e-infraestruturas, beneficiando-se de investimentos prévios realizados no Brasil e Europa.

De acordo com Wouter Los, coordenador do projeto LifeWatch, um legado importante do projeto EUBrazilOpenBio foi o desenvolvimento de tecnologias amigáveis (user-friendly) para apoiar a cooperação internacional. "O EUBrazilOpenBio abriu novos caminhos para a integração de comunidades levando em conta processos tecnológicos e sociológicos". Los ainda ressalta que “o projeto servirá como exemplo para orientar futuras iniciativas de apoio à investigação colaborativa sobre biodiversidade. A criação de novos modelos de cooperação sustentável para o desenvolvimento de sistemas distribuídos, bem como para fomentar novas interações com parceiros públicos e privados, é fundamental nesta nova era de pesquisa”.

Visando orientar ações futuras, o consórcio EUBrazilOpenBio elaborou um plano de ação, intitulado "Uma visão para acelerar a cooperação entre o Brasil e a Europa, reforçando os laços com as comunidades de pesquisa e negócios". A ideia é impulsionar novas abordagens multidisciplinares para a biodiversidade, incluindo instituições de pesquisa com programas de pós-graduação reconhecidos internacionalmente e o uso de infraestruturas compartilhadas. O plano também identifica oportunidades para as pequenas e médias empresas envolvidas com serviços de computação em nuvem, incluindo a criação de serviços de agregação de valor em torno de dados de acesso livre e aberto.

O objetivo final do projeto foi demonstrar que as abordagens novas e criativas para a descoberta científica tornarão possível dominar os principais desafios técnicos relacionados ao compartilhamento e uso de dados sobre biodiversidade. O Brasil e a Europa têm muito a contribuir para o aprimoramento da infraestrutura de dados e de serviços web. Ao agregar a diversidade de talentos que existe na área de informática a todas as outras áreas de pesquisa em biodiversidade, a cooperação internacional pode tornar a pesquisa colaborativa mais eficiente, mais aberta e multidisciplinar.

*Publicado originalmente em inglês no dia 23 de outubro de 2013.

Saiba mais!



[tradução atualizada em 29.10 às 14:12]

10 de out. de 2013

Herbários de Recife discutem melhoria na qualidade dos dados

Visita promovida pelo CRIA e INCT-Herbário Virtual da Flora e dos Fungos dá continuidade ao trabalho de identificar os principais avanços e dificuldades dos herbários nacionais, discutindo a qualidade dos dados disponibilizados.

Da esquerda para direita: Gabriel Mendes (UFP), Alcina Viana (IPA), Cheysa Figueredo (IPA), Angela Miranda (HST), Marlene Barbosa (UFP), Maria Elizabeth (PEUFR), Rita Pereira (IPA) e Flávia Pezzini (CRIA/INCT-HVFF).

De 30 de setembro a 4 de outubro, a equipe do Centro de Referência em Informação Ambiental (CRIA) e do INCT-Herbário Virtual da Flora e dos Fungos (INCT-HVFF) reuniu em Recife curadores, técnicos e bolsistas dos herbários da região para discutir a melhoria da qualidade dos dados compartilhados através da rede speciesLink. Participaram cinco herbários de Recife que fazem parte da rede do INCT-HVFF: URM (Herbário Pe. Camille Torrand), UFP (Herbário Geraldo Mariz), IPA (Herbário Dárdano de Andrade Lima), HST (Herbário Sérgio Tavares) e PEUFR (Herbário Professor Vasconcelos Sobrinho). O URM representa a maior coleção de fungos herborizados na América Latina, com 84.500 registros, dos quais mais de 90% estão online. O UFP possui 58.540 registros de plantas principalmente do Nordeste, dos quais cerca de 60% estão online. O HST conta com um acervo de 19.681 registros, 100% online e 680 registros com imagens associadas. O PEUFR possui um acervo de 51.473 registros, dos quais cerca de 35% estão online. O IPA é a mais antiga fonte de informação sobre a flora do Nordeste e abriga cerca de 81.000 registros, dos quais cerca de 80% estão online.

Análise conjunta da ferramenta dataCleaning para dignosticar erros e direcionar a correção.

A visita dá continuidade ao trabalho de identificar os principais avanços e dificuldades de cada herbário, discutindo a padronização e qualidade dos dados ao realizar uma análise conjunta do relatório dataCleaning. Esse contato próximo com os curadores, técnicos e bolsistas contribui muito para os familiarizar mais com a ferramenta e fazer uma análise comparativa dos erros de cada herbário. A ferramenta dataCleaning procura evidenciar os dados que podem conter erros, por exemplo, em relação às informações gerenciais de curadoria (número de tombo, registros repetidos), aos dados taxonômicos (erros de grafia, diferentes nomes de autor para a mesma espécie), à data (ano de identificação anterior ao da coleta, ano de coleta maior do que a última atualização) ou aos dados de georeferenciamento (ausência de sinal em latitudes ou longitudes negativas, coordenadas que caem no mar).

Herbário UFP, que abriga registros de plantas principalmente da região Nordeste.

Todos os herbários participantes frequentemente atualizam os dados enviados ao speciesLink e estão fortemente empenhados em sua correção. Por exemplo, para todos eles não há mais registros suspeitos relacionados a erros de grafia para Famílias e Gêneros. Além desse diagnóstico, os participantes levantaram questões importantes como a atualização dos nomes de estados e municípios (por exemplo, devemos atualizar o estado para as coletas feitas em Tocantins antes da sua criação?) e a padronização dos nomes dos coletores e determinadores. Sugestões para essas questões podem ser consultadas no repositório de documentos do speciesLink [disponível aqui]. Esses documentos foram desenvolvidos pela equipe do CRIA após a Conferência Internacional: o INCT Herbário Virtual da Flora e dos Fungos e e-infraestruturas para Biodiversidade, ocorrida em setembro de 2012 na qual todos os herbários estavam presentes.

Leonor Costa Maia, coordenadora do INCT-HVFF e curadora do URM, e João Batista de Oliveira, biólogo do URM.

Outro ponto que merece atenção está relacionado a um dos formatos utilizado pelo BRAHMS, adotado por algumas coleções participantes, para inserir coordenadas geográficas. Existe um artifício criado pelos programadores para anotar informações sobre as coordenadas geográficas que pode gerar confusão. O BRAHMS permite a entrada de dados no formato de GMS (graus, minutos e segundos) por meio de um formato intermediário que se assemelha ao formato de GD (graus decimais), mas que o BRAHMS interpreta como formato GMS. Isso reduz a necessidade de incluir símbolos que costumam gerar erros, mas se não for devidamente informado pode gerar uma interpretação errônea.


Para ver mais fotos das visitas aos herbários, clique aqui. 

Saiba mais!

Texto e Fotos - Ricardo Braga Neto e Flávia Pezzini

4 de out. de 2013

Curso sobre curadoria de dados de herbário com ênfase no software BRAHMS

Dias 9 e 10 de novembro de 2013 o INCT- HVFF e a comissão organizadora do 64o Congresso Nacional de Botânica promoverão o curso intitulado: "Curadoria de dados de herbário com ênfase no software BRAHMS". Inscrições até 13 de outubro.



O INCT- Herbário Virtual da Flora e Fungos do Brasil em parceria com a comissão organizadora do 64o Congresso Nacional de Botânica que ocorrerá em Belo Horizonte, de 10 a 15 de novembro de 2013, promoverá o curso pré-congresso intitulado: "Curadoria de dados de herbário com ênfase no software BRAHMS"

Responsáveis: Flávia Pezzini (CRIA/INCT-HVFF) e Marina Melo (UNB)

Data/Horário: 09/11/2013 (sábado) das 8-12h e 14-18h e 10/11/2013 (domingo)
das 8-12h

Carga Horária: 12 horas

Público-alvo: curadores de herbário, técnicos de herbário e estagiários.

Requisitos: encaminhar requisição de inscrição (formulário abaixo preenchido).

O link para formulário:
https://docs.google.com/forms/d/1Epf5-LrkdUT7reQnxchRIYsZ3LCY1HriO8MRuelqp88/viewform

Prazo das inscrições: até 13/outubro/2013

Número de vagas: 5

Local do curso: UFMG/Belo Horizonte/MG

2 de out. de 2013

Um novo conceito estrutural para transmitir conhecimento sobre biodiversidade

Publicação organizada pelo GBIO (Global Biodiversity Informatics Outlook) define passos fundamentais para melhor explorar a abertura dos dados e o desenvolvimento da tecnologia da informação visando melhorar a tomada de decisão informada.


Uma nova iniciativa lançada hoje (02 de outubro) tem como meta coordenar ações e financiamentos globais para disponibilizar a melhor informação possível sobre a vida na terra e nossos impactos sobre ela. O GBIO define a base conceitual para se apropriar de todo o potencial da tecnologia da informação e da cultura de acesso aberto a dados para reunir evidências sobre biodiversidade e informar os processos de decisão.

Clique na imagem para ampliar.

A base conceitual proposta está descrita em um documento denominado Delivering Biodiversity Knowledge in the Information Age, convidando formuladores de políticas, gestores, pesquisadores, especialistas em informática, provedores de dados e outros para concentrar os esforços em torno de quatro áreas chave onde é necessário avançar:
  • Cultura: promoção de práticas e infraestruturas para o compartilhamento de dados, utilizando padrões comuns e arquivos permanentes, apoiados por incentivos e por uma comunidade de especialistas comprometidos.
  • Dados: trabalhando na necessidade de transformar todos os dados sobre espécies, passado e presente, em formatos digitais acessíveis e utilizáveis, desde coleções e literatura histórica até observações da ciência cidadã, sensoriamento remoto e sequenciamento genético.
  • Evidência: organizando e acessando dados de todas as fontes para prover visões claras, consistentes e contextualizadas; incluindo organização taxonômica, ocorrências integradas no tempo e espaço, interações de espécies e melhorando a qualidade dos dados através da curadoria colaborativa.
  • Compreensão: construção de modelos a partir de medidas e observações para dar suporte à pesquisa orientada por dados e planejamento baseado em evidências, incluindo ferramentas preditivas, melhor visualização e feedback para priorizar a captura de novos dados.

Saiba mais!

25 de set. de 2013

Visitas a coleções promovem melhorias na qualidade dos dados

Trabalho conjunto do comitê gestor do INCT-Herbário Virtual da Flora e dos Fungos, da equipe do CRIA, e de curadores, técnicos e bolsistas de herbários nacionais está promovendo a melhoria da qualidade dos dados disponibilizados na rede speciesLink.

Técnica e bolsista do herbário ALCB em Salvador.

Desde o início de 2013, uma bolsista do REFLORA/INCT-Herbário Virtual da Flora e dos Fungos (INCT-HVFF) no Centro de Referência em Informação Ambiental (CRIA) vem trabalhando com a melhoria da qualidade dos dados disponibilizados na rede speciesLink. As visitas aos herbários nacionais participantes do INCT-HVFF têm como objetivos: identificar os principais avanços e as principais dificuldades de cada herbário, discutir a qualidade dos dados e realizar uma análise conjunta do relatório dataCleaning, uma ferramenta desenvolvida pelo CRIA com o objetivo de auxiliar os curadores, técnicos e bolsistas a melhorar a qualidade dos dados disponibilizados online.

Equipe do HUESB, na UESB em Jequié, Bahia

A ferramenta dataCleaning procura evidenciar os dados que podem conter erros, por exemplo, em relação às informações gerenciais de curadoria (número de tombo, registros repetidos), aos dados taxonômicos (erros de grafia, diferentes nomes de autor para a mesma espécie), à data (ano de identificação anterior ao da coleta, ano de coleta maior do que a última atualização) ou aos dados de georeferenciamento (ausência de sinal em latitudes ou longitudes negativas, coordenadas que caem no mar). A partir da identificação dos dados suspeitos, cada coleção confere os dados originais, faz as correções necessárias e atualiza os dados no speciesLink. A rede defende a autonomia e responsabilidade do provedor pelos seus dados, mas é imprescindível que o formato dos dados seja coerente entre os provedores para permitir seu uso de forma integrada e abrangente.

Detalhes do UESC: armário com exsicatas, sala do herbário e consulta às amostras.

Visitas também promovem a melhoria da ferramenta dataCleaning
As visitas têm se mostrado bastante eficientes para a melhoria da qualidade dos dados dos herbários, pois revisar os dados suspeitos no próprio sistema do herbário e consultar as exsicatas in loco facilita o entendimento da ferramenta e a identificação dos erros. Em agosto de 2013, seis herbários pertencentes ao INCT-HVFF foram visitados em cinco cidades e dois novos herbários foram convidados a participar da rede (figura abaixo). Contudo, além de promover a melhoria na qualidade dos dados, as visitas realizadas pela bolsista do REFLORA/INCT-HVFF também contribuíram para melhorar a ferramenta, atendendo várias demandas dos herbários.

Localização dos herbários visitados em agosto de 2013.

Dentre as melhorias propostas, a equipe do HUEFS fez sugestões relevantes para acelerar o tempo de correção de erros pensando em aspectos práticos de como são armazenadas as exsicatas. Para este herbário, o tempo gasto na avaliação do relatório dataCleaning seria reduzido se todas as exsicatas de uma mesma família pudessem ser retiradas do armário e corrigidas de uma só vez. Hoje, em alguns dos itens do dataCleaning, cada registro suspeito é visualizado individualmente, não podendo ser agrupado por família. Esse processo de aprimoramento tem auxiliado a traçar uma estratégia para os próximos treinamentos e para o desenvolvimento do material de apoio.


Para ver mais fotos das visitas aos herbários, clique aqui.

Para fazer uma busca na rede speciesLink insira os termos abaixo:



Saiba mais!

Texto – Ricardo Braga Neto e Flávia Pezzini
Fotos – Flávia Pezzini

14 de ago. de 2013

Visitas às coleções de Sergipe e da Bahia

Nos próximos 15 dias, diversos herbários de Sergipe e da Bahia receberão a visita da bolsista do INCT Herbário Virtual da Flora e dos Fungos responsável pela qualidade dos dados.


Alunos do laboratório de Liquenologia (LALIC) com a professora Dra. Marcela Cáceres no campus Professor Alberto Carvalho da UFS, em Itabaiana - SE. O Herbário ISE possui cerca 16.000 registros de líquens e pertence a rede INCT - HVFF desde o início de 2013.
O herbário ISE, de Itabaiana - SE foi o primeiro a ser visitado nos dia 13 e 14/08/2013. Até dia 28/08, a bolsista percorrerá as cidade de Itabaiana (SE), Salvador, Cruz das Almas, Feira de Santana, Jequié e Ilhéus (todas na BA), visitando mais de 9 herbários. O objetivo é realizar uma análise conjunta do relatório dataCleaning, discutir a qualidade dos dados e conhecer os principais avanços e as principais dificuldades dos herbários. A melhoria da qualidade dos dados é uma preocupação constante tanto do INCT-HVFF quanto do CRIA, e bons resultados tem sido alcançados graças aos eventos de treinamento, ao uso das ferramentas e ao enorme empenho dos responsáveis pelos acervos.

Acompanhe as notícias sobre as visitas pelo Facebook do CRIA e também pelo Twitter.

6 de ago. de 2013

Ferramenta dataCleaning da rede speciesLink é citada na revista TREE

O artigo “Biodiversity data should be published, cited, and peer reviewed”, publicado na edição de agosto de 2013 na revista Trends in Ecology & Evolution (TREE), cita a rede speciesLink como pioneira na produção de métricas úteis para melhorar a qualidade dos dados disponíveis.



O trabalho publicado por Mark J. Costello e colaboradores sugere que a publicação de dados brutos deve seguir o modelo de publicação de artigos e a qualidade desses dados garantida por meio de processos automatizados de verificação de qualidade, revisão por pares e decisões editoriais. Os autores discutem meios de incentivar a publicação dos dados, assim como melhorar a integração com outros conjuntos de dados.

A publicação de dados aumenta a visibilidade de resultados científicos. Segundo os autores, infraestrutura e capacidade de armazenamento já existem para dados de biodiversidade, mas sua taxa de publicação, mesmo em crescimento, ainda é menor do que a esperada. Além disso, pouca atenção tem sido dada à qualidade dos dados que já foram disponibilizados. A melhoria da qualidade dos dados é importante para garantir sua maior acurácia, diminuir o tempo de manejo pelo usuário e aumentar sua taxa de reuso.

Distribuição geográfica dos pontos de ocorrência dos espécimes coletados ou observados mantidos nas coleções participantes da rede speciesLink.

Em relação à qualidade, o artigo propõe um processo em etapas de controle e garantia de qualidade de dados antes da publicação, que inclui ferramentas automáticas. Como exemplo, os autores citam a rede speciesLink, que através da ferramenta dataCleaning disponibiliza aos usuários métricas relacionadas ao número de registros, espécies e localidades geográficas, validação de nomes, e completude dos dados e metadados.

A rede speciesLink, que no mês de julho de 2013 superou o marco de 6 milhões de registros de ocorrência de espécies da flora, fauna e microbiota, juntamente com o INCT Herbário Virtual da Flora e dos Fungos (INCT-HVFF) têm trabalhado nesse desafio da melhoria da qualidade dos dados utilizando um conjunto de aplicativos que compõe a ferramenta dataCleaning. O trabalho de correção dos erros e de aumento da qualidade dos dados da rede speciesLink tem sido aprimorado graças aos eventos de treinamento, ao uso das ferramentas e ao enorme empenho dos responsáveis pelos acervos.

Veja o artigo completo, que é de livre acesso:
Mark J. Costello, William K. Michener, Mark Gahegan, Zhi-Qiang Zhang, Philip E. Bourne. Biodiversity data should be published, cited, and peer reviewed. Trends in Ecology & Evolution - 1 August 2013 (Vol. 28, Issue 8, pp. 454-461). [link].

Saiba mais!

1 de jul. de 2013

O desafio para melhoria da qualidade dos dados no INCT-HVFF

O volume e o uso dos dados disponíveis de forma livre e aberta tem crescido exponencialmente. Mas sua utilidade a longo prazo está diretamente relacionada com sua qualidade, um desafio que pode ser alcançado com treinamentos e envolvimento de todos os interessados. 


Estudar a biodiversidade e integrar o conhecimento gerado representa um desafio imenso para o Brasil. O Herbário Virtual da Flora e dos Fungos (INCT-HVFF) está abordando a questão de forma pioneira, atuando em pesquisa, formação de recursos humanos e transferência de conhecimento para a sociedade. O volume de dados disponíveis vem crescendo exponencialmente desde 2008, assim como o uso desses dados. Entretanto sua qualidade ainda é uma questão que merece atenção. Uma grande porcentagem dos registros não possui georreferenciamento, existem erros de grafia nos nomes taxonômicos e grande parte da informação está incompleta, por exemplo, sem dados sobre a classificação taxonômica, o que pode dificultar sua busca e recuperação.

Visita ao Herbário SPF (USP – São Paulo) em junho de 2013: é importante que os bolsistas responsáveis pela entrada de dados também participem do treinamento 

Estão disponíveis no site do CRIA ferramentas de dataCleaning que auxiliam os curadores a identificarem os registros suspeitos em suas coleções. O INCT Herbário Virtual da Flora e dos Fungos possui uma bolsista responsável por visitar as coleções inicialmente com o objetivo de realizar uma análise conjunta do relatório dataCleaning, discutir a qualidade dos dados e conhecer os principais avanços e as principais dificuldades dos herbários. As visitas iniciais foram feitas individualmente em coleções próximas a Campinas, local sede do CRIA. A partir dessa experiência, um curso será montado, assim como guias de melhores práticas. A partir do segundo semestre de 2013, esse curso será oferecido em todas as regiões do país, para que representantes de todas as coleções participantes do INCT-HVFF recebam treinamento.

Equipe do CRIA/INCT HVFF, técnicos e bolsistas do SPF: a participação de todos é importante para a efetividade do treinamento para melhoria da qualidade dos dados.

Saiba mais!



21 de jun. de 2013

Novas ferramentas no BRAHMS facilitam o envio de dados para a rede speciesLink

A versão 7.3 do BRAHMS, lançada na última sexta-feira, dia 14/06/2013, possui importantes implementações que facilitam o envio de dados para a rede speciesLink e permitem a inclusão de mais informações. 



Agora com apenas um clique os usuários podem exportar os dados de suas coleções no modelo de dados DarwinCore. No menu Admin, basta selecionar a opção XML/Darwin export options e depois Darwin Core (suitable for CRIA transfers) e em seguida selecionar o código da própria coleção.

Tela de exportação de dados para o CRIA na versão 7.3.2. em Admin – XML/Darwin export options – Darwin Core (suitable for CRIA transfers).

Outra importante novidade é a exportação dos campos de classificação taxonômica ORDER (ordem) e DIVISION (divisão/filo). A inclusão de dados nesses campos melhora a qualidade das informações disponíveis e aumenta a eficácia das buscas na rede. Informações que podem parecer óbvias internamente para cada coleção, são essenciais quando estamos lidando com a integração de dados de várias coleções na rede. Para plantas e fungos, por exemplo, normalmente as informações taxonômicas são preenchidas somente até família. Se um usuário deseja buscar os registros de todas as briófitas, por exemplo, terá que incluir no formulário de busca todas as famílias! Nesse caso, se todos os registros tivessem o campo divisão/filo preenchido, bastaria buscar por Marchantiophyta | Anthocerotophyta | Bryophyta. O mesmo ocorre para fungos. Muitas coleções possuem um só banco de dados para fungos e plantas. Novamente, para encontrar somente os fungos, o usuário teria que realizar uma busca por todas as famílias. Tem-se ainda que essas buscas retornariam somente os registros que possuem a determinação de família. Na rede speciesLink atualmente existem cerca de 3,4 milhões de registros sem a informação de divisão para plantas e fungos.

Staheliomyces cinctus (Phallaceae, Basidiomycota), um fungo raro que ocorre apenas na região Neotropical (foto: Mario Terra).

Completando as informações
As informações taxonômicas para as espécies podem ser inseridas rapidamente no BRAHMS no menu Taxa – Ver/editar famílias no banco de dados. Nessa tabela estão listadas as famílias com registros na sua coleção e basta incluir a informação de ordem e divisão uma única vez para cada família.

Essas modificações foram sugeridas aos desenvolvedores do BRAHMS após conversas com os usuários. Participe também, mande suas sugestões! E não se esqueça de sempre consultar as dicas de uso no menu superior direito da página de busca do speciesLink!

Saiba mais!
  • Um manual chamado “Tutorial para extração dos dados no modelo DarwinCore (a partir da versão 7.3.1 do BRAHMS)“ com as instruções detalhadas está disponível em: http://splink.cria.org.br/splinker