Essa é uma revisão anterior do documento!
Processamento Reproduzível e Aberto de Dados nas Ciências Florestais
A Disciplina LCF5900 - Processamento Reproduzível e Aberto de Dados Científicos (2022) tem por objetivo propor e apresentar um conjunto de procedimentos, ferramentas, que permitem aos pesquisadores tratar os dados de forma aberta e reproduzível.
Para a turma de 2022 foi escolhido o tema:
Environmental Science (Open Forestry, Tools and Applications).
Onde detalhamos e abordamos aspectos da ciência de dados abertos para as ciências ambientais, com um maior foco para a Engenharia Florestal.










Open Forestry
Esta página é baseada no Comentário Científico: Making forest data fair and open. Revista Nature Ecology & Evolution
Conceitos importantes:
Open Data - Conforme o Open data Handbook, Dados abertos são dados de pesquisas que estão disponíveis livremente na internet para download, mudanças e distribuição sem restrições legais ou financeiras.
FAIR - Findability(Habilidade de Encontrar), Accessibility(Acessibilidade), Interoperability(Interoperabilidade), and Reuse of digital assets (Possibilidade de Reusar).
“Em uma sociedade com altas necessidades de dados sobre florestas tropicais, como podemos romper a barreira social entre os produtores de dados florestais e os usuários de dados florestais?” Este é o primeiro sentimento deixado pelos autores do comentário científico. Mas você deve se perguntar: Qual o porquê deste interesse por estes dados neste recorte do planeta? Primeiramente, as regiões que correspondem as florestas tropicais são os ecossistemas mais ricos e produtivos do planeta terra, assinalam Lima e colaboradores. Além disso, a quantificação (valores, mesmo) de dinâmicas de carbono, biodiversidade e como estes estão mudando são ultra valiosos e muitos stakeholders estão interessados nestes dados. Os interessados vão desde cientistas, governos, ongs, à interesses comerciais como extração madeireira ou venda de créditos de carbono. Os autores destacam que um grupo muito ignorado, quando se fala dos interesses com as florestas tropicais são as próprias comunidades locais, estes os quais a informação se faz mais necessária e os garante direitos e ajuda na conservação e restauração de suas florestas.
De forma panorâmica, é preciso que os dados se apresentem de forma FAIR(ver descrição no superior desta página) e OPEN. Assim, será possível aumentar a transparência, inovação e reprodutibilidade. E não se enganem! Existem sim, bancos de dados, OPEN e FAIR. Como i.e. GBIF, GenBank e Global Forest Watch. Mas, nestes, não existem a perspectiva daqueles que fazem as mensurações, na prática. O argumento dos autores do texto é: Políticas de dados florestais devem usar de forma linguisticamente correta o termo FAIR - justo, equitativo, leal.
“Em um mundo onde originar (mensuração, monitoramento...) dados florestais é considerado como um investimento de longo prazo, transformar estes dados em abertos faz todo sentido (já que todos podem contribuir no seu investimento)”.
"Mas quando a produção destes dados depende na insegurança de financiamentos incertos e condições precárias de empregabilidade, tornar estes dados aberto é, digamos, problemático."
Sendo assim, compreende-se, somente um grupo privilegiado do globo está capaz de explorar o potencial de dados florestais (de forma aberta). E sobre as comunidades que possuem o saber de suas florestas locais, estas estão em constante risco, já que saber informações como o valor de uma determinada madeira de uma determinada espécie, pode ameaçar toda sua comunidade.
Desafios
Os riscos, medos, incertezas são muitos quando falamos em dados florestais. Principalmente por que gerar dados acompanhados ao longo de muitos anos exigem grandes esforços. Falando em Floresta Amazônica, esses esforços aumentam exponencialmente. É preciso combinar fatores múltiplos como instituição, legislação e interesses. Para 1 hectare mensurado na amazônia é preciso coletar e ter capacidade de identificar 10 vezes mais espécies que os 24 milhões de hectares do Reino Unido.
Outro desafio importante é que os trabalhadores florestais (pesquisadores, técnicos, estudantes, assistentes de campo e comunidades locais) não possuem atrativos básicos que garantam seu trabalho. Desde segurança no campo (ameaças, sequestros, picada de cobra, enchentes, incêndios, violência baseada em gênero e aos membros da comunidade LGBTQIA+...) até recursos básicos para mensuração e manutenção das suas áreas de interesse e estudo.
Há alguns exemplos de sucesso como o do vídeo a seguir:
Como superar estes desafios?
Como os desafios são enormes, a primeira pergunta é: será possível mudar essa realidade para beneficiar igualitariamente os geradores dados e usuários? Os autores do comentário científico acreditam que o futuro dos dados de florestas tropicais deve ser aberto, como no caso de dados biológicos (sequenciamento de DNA). Mas para esse futuro, é necessário um acordo internacional entre os que geram estes dados, usuários e financiadores.
Os autores apresentam 8 recomendações-chave que está baseada nas necessidades daqueles que geram os dados e garante a contribuição adequada dos usuários e financiadores.
Pensar em monitoramento de florestas a longo prazo é uma tarefa árdua e deve haver valorização de pessoas, estas recomendações, portanto, buscam atender, em primeiro lugar as pessoas, ao invés dos dados. Consequentemente, é necessário encarar com seriedade os custos reais da geração de dados florestais, com melhores planos de carreira para aqueles que estão no trabalho de campo. Para este plano financeiro está incluso:
- Trabalho de campo, trabalho de laboratório (incluindo apoio de centros de herbário);
- Treinamento, Segurança do trabalho e condições asseguradas para o trabalho;
- Integração de instituições responsáveis pela entrega dos dados;
- Cobrir os custos de curadoria e infraestrutura de database garantindo padronização dos dados.
- Adotar definições gerais sobre autorias e incluir aqueles envolvidos na coleção dos dados e manejo; e
- Garantir que os resultados sejam comunicados NA LINGUAGEM DAQUELES QUE OS GERARAM. (Claro, dividimos o mesmo mundo, mas capacidade de investimento em pesquisa é altamente desigual);
- Acordos internacionais e financiamentos que apoiem a geração de dados, infraestrutura e carreiras são importantes para empoderar instituições tropicais e subtropicais;
- Desenvolver, relações estreitas, longevas e igualitárias, que estabeleçam metas para financiadores, geradores e usuários destes dados.
Assim, de forma conjunta, é possível garantir que os financiadores estão apoiando caminhos para o lançamento de dados abertos e de open science.
Com relação àqueles que geram os dados, é preciso:
Mudanças sistêmicas de sucesso demandam que se construam parcerias onde há divisões. Nossas necessidades compartilhadas de estabilizar o clima e proteger a biodiversidade devem incentivar acordos globais e leis nacionais, para que haja compreensão dos princípios de direitos e deveres, por todos.
Em resumo, Para dados de florestas tropicais se tornarem OPEN, eles, primeiramente devem ser FAIR!
Esta página é baseada no artigo dos autores: Renato A. F. de Lima, Oliver L. Phillips, Alvaro Duque, J. Sebastian Tello, Stuart J. Davies, Alexandre Adalardo de Oliveira, Sandra Muller, Euridice N. Honorio Coronado, Emilio Vilanova, Aida Cuni-Sanchez, Timothy R. Baker, Casey M. Ryan, Agustina Malizia, Simon L. Lewis, Hans ter Steege, Joice Ferreira, Beatriz Schwantes Marimon, Hong Truong Luu, Gerard Imani, Luzmila Arroyo, Cecilia Blundo, David Kenfack, Moses N. Sainge, Bonaventure Sonké & Rodolfo Vásquez.
LIMA, R.A.F et al. Making forest data fair and open. Nature Ecology & Evolution, p. 1-3, 2022.
Redação: Jorge Monteiro
Ferramentas
O movimento de ciência aberta defende artigos de acesso livre, dados de pesquisa compartilhados, metodologia de pesquisa completa, repositórios legíveis por máquina e muitas outras formas de promover resultados de pesquisa amplamente divulgados. A ciência aberta pode possibilitar o aprofundamento de uma determinada pesquisa, verificar sua reprodutibilidade, permitir a realização de estudos metacientíficos em grupos de pesquisa e permitir a obtenção de novos insights combinando muitos conjuntos de dados usando algoritmos de aprendizado de máquina.
Tais habilidades certamente facilitarão a criação de conhecimento mais eficiente e podem até abrir novos rumos de pesquisa. A ciência aberta permite diversos usos de artigos e ferramentas de pesquisas integradas para a elaboração de projetos públicos oriundos do open science, além disso, seguir os princípios para que este trabalho seja FAIR.
Aqui estão alguns repositórios de dados sem fins lucrativos que cumprem os princípios FAIR:
Harvard Dataverse
Hospedado pela Harvard University, este repositório de dados oferece armazenamento gratuito de dados de pesquisa. Como todos os serviços desta lista, ele atribuirá um Identificador de Objeto Digital aos seus dados para garantir que sejam creditados a você.
De propriedade da Microsoft, o GitHub tornou-se o repositório de dados padrão para codificadores. 500 MB de espaço público privado e ilimitado são oferecidos gratuitamente.
OpenStreetMap
Plataforma aberta para obtenção de informações geográficas de malhas urbanas espalhadas pelo mundo, com atribuições específicas sobre o ambiente em questão.
Ebird
Plataforma de ornitólogos que realizam ciência cidadã para a obtenção de diversidade de espécies de aves em todo o perímetro florestal e urbano do mundo.
Google Scholar
O mecanismo de busca acadêmico também oferece estatísticas de desempenho dos usuários que criaram um perfil.
Mendeley
Mostra todos os tipos de estatísticas, incluindo contagem de citações, índice h, artigos baixados, etc. Você precisará registrar um perfil para vê-lo. Propriedade da Elsevier.
Publons
Originalmente desenvolvido para rastrear revisões por pares, mas agora oferece uma variedade de estatísticas de desempenho do pesquisador. Propriedade da Clarivate.
ORCiD
ORCID significa Open Researcher and Contributor Identifier. A organização sem fins lucrativos por trás do ORCID decidiu vincular inequivocamente um pesquisador à sua pesquisa. Além de uma lista de publicações, a plataforma centraliza todas as suas realizações acadêmicas, como registros de afiliação e educação, bolsas recebidas, prêmios e subsídios, bem como contribuições de revisão por pares. O ORCID obtém os dados de (entre outros) Crossref que cria links persistentes para publicações na forma de DOIs. O ORCID também se integra a outros bancos de dados e serviços, para que você possa, por exemplo, sincronizá-lo com seu perfil do LinkedIn.
Além disso, existem linguagens de programação gratuitas que permitem a manutenção e análise dos dados obtidos através das plataformas open science para a elaboração de produtos que ofereçam o mesmo serviço integrado e aberto para a população, como por exemplo o Python e o R.
O vídeo a seguir comenta sobre algumas ferramentas para que a pesquisa seja aberta e reproduzível:
A ciência aberta ainda enfrenta muitos problemas, incluindo classificação, rotulagem, curadoria, armazenamento, compartilhamento e direitos autorais. Claramente, algo mais do que as boas intenções de um único pesquisador será necessário para superar esses problemas. Portanto, o compartilhamento de dados aumenta a credibilidade do trabalho e pesquisador e servirá ao bem maior do avanço da ciência em geral.