Quanta precisão é necessária? Examinando os dados de alteração de cobertura vegetal global GLAD (Parte 1)

A Parte 2 dessa série de blog encontra-se disponível aqui. Em 2013, o Dr. Matt Hansen e os seus colaboradores da Universidade de Maryland, do grupo de Análises e Descobertas de Territórios Globais (GLAD), juntamente ao Google, Serviço Geológico dos EUA (USGS) e a Administração Nacional de Aeronáutica e Espaço (NASA) divulgaram o primeiro método de escala global para o monitoramento anual das mudanças na cobertura vegetal usando imagens de resolução Landsat de 30 metros, revolucionando a maneira como as florestas são avaliadas e monitoradas. Os dados das mudanças de cobertura vegetal do GLAD (anteriormente designados como os dados de mudança de cobertura vegetal Hansen) consistem em dois mapas: um da perda anual de cobertura vegetal de 2001-2014, E o outro do ganho acumulado de cobertura vegetal durante o período entre 2000-2012. O Global Forest Watch (GFW) disponibiliza essas informações livremente na Internet para que todos possam visualizá-las e analisá-las através do seu mapa interativo simples de usar. Além da plataforma rica em análises, o Blog GFW tem como objetivo ajudar as pessoas comuns a compreender os dados, explicando os métodos subjacentes e os resultados em termos acessíveis. Esse blog é o primeiro de uma série de duas partes técnicas que abordam a precisão dos dados de mudança de cobertura vegetal globais do GLAD. Nesta parte, vamos explicar como os autores mediram com precisão os dados, e na segunda parte vamos explorar o que isso significa para quem está acessando as informações.
Como podemos medir a precisão de dados de sensoriamento remoto?
Na detecção remota, a precisão dos dados é medida pela comparação entre a alteração detectada em amostras de área de um mapa com as verdadeiras alterações de cobertura vegetal do local, também conhecidos como “dados verdadeiros”, o que é geralmente determinado por meio de outras imagens de satélite ou visitas de campo. É uma boa prática avaliar os “dados verdadeiros” de forma independente ou sem olhar para o mapa em fase de avaliação, porque isso garante que os investigadores sejam imparciais em suas avaliações. A precisão geral é o percentual da amostra de pixels em que o mapa e os dados verdadeiros apresentam variações. No entanto, a precisão geral pode ser superestimada quando a cobertura vegetal estável (nesse caso, florestas inalteradas) prevalece sobre as mudanças (perda e ganho) – os erros na identificação de mudanças são sobrepujados pela forma como o computador identifica a cobertura vegetal estável. Examinar os falsos positivos (também conhecidos como erros de comissão) e os falsos negativos (também conhecidos como erros de omissão) das mudanças pode proporcionar uma visão mais correta da precisão dos dados. Um falso positivo é um pixel de 30 metros rotulado como “perda” ou “ganho” no mapa, mas que não se alterou no mundo real. Um falso negativo é o oposto, um pixel rotulado como “nenhuma mudança” pelos dados sendo que na verdade houve ganho ou perda de cobertura vegetal.
O quão precisos são os dados de alteração da cobertura vegetal GLAD?
Os autores dos dados publicaram duas avaliações de precisão até a presente data, a primeira no original Science article por Hansen et al. (2013) e a segunda em um estudo recente de Tyukavina et al. (2015) sobre a perda de carbono em florestas. No primeiro estudo, os autores avaliaram de forma independente a verdadeira mudança de 1.500 blocos de amostras (120 metros de cada lado) usando imagens do Landsat, MODIS e Google Earth. Os dados verdadeiros foram, então, comparados com os mapas de “perda” e “ganho” a nível mundial, e dentro dos quatro grandes biomas – tropical, subtropical, temperado e boreal. Em uma escala global, o mapa de “perda” tinha uma taxa de falsos positivos de 13% e uma taxa de falso negativo de 12%. O mapa de “ganho” teve uma taxa significativamente mais elevada de erro, com uma taxa de falso-positivo de 24% e uma taxa de falso negativo de 26%. Os erros de “perda” e “ganho” variam consideravelmente entre os quatro grandes biomas, o que sugere que a precisão pode ser maior ou menor dependendo da localização em particular.
PERDA | GANHO | |||
---|---|---|---|---|
Bioma | Falso-positivos | Falso-negativos | Falso-positivos | Falso-negativos |
Global | 13% | 12,2% | 23,6% | 26,1% |
Tropical | 13% | 16,9% | 18,1% | 52,0% |
Subtropical | 20,7% | 20,6% | 14,5% | 17,6% |
Temperado | 11,8% | 6,1% | 38,0% | 23,5% |
Boreal | 12,2% | 6,1% | 23,3% | 1,6% |
Os autores realizaram outro teste para determinar a precisão temporal dos dados de “perda”, na medida em que o mapa detecta perdas no ano correto. Usando os mesmos 1.500 blocos, os autores compararam o ano da “perda” no mapa com a maior mudança nos blocos de validação. Eles descobriram que o ano atribuído às perdas de cobertura vegetal observado foi correto em 75,2% das vezes, e estava correto um ano antes ou depois em 96,7% das vezes. Enquanto o primeiro estudo mostrou a precisão em escalas regionais e globais, o segundo estudo tratou da precisão dos dados nos trópicos e em uma resolução maior. O segundo estudo analisou a precisão de 3.000 pixels individuais (30 x 30 metros), distribuídos por regiões tropicais da África Subsaariana e Sul e Sudeste da Ásia e da América Latina, em comparação com os dados verdadeiros das imagens do Landsat e Google Earth. Eles encontraram taxas ativas e positivas abaixo de 20% em todas as áreas, exceto na África Subsaariana, que teve 48% de falsos negativos. Os autores suspeitam que a baixa precisão na África esteja relacionada com a prevalência de distúrbio em pequena escala, o que é mais difícil de mapear com uma resolução de 30 metros. Descobriram também que mais de 85% de falso-negativos ocorrem dentro de um pixel mapeado como “perda”, sugerindo que a maior parte do equívoco na perda ocorre nos blocos adjacentes de outras áreas de perda.
PERDA | GANHO | |
---|---|---|
Continente | Falso-positivos | Falso-negativos |
África subsaariana | 4% | 48% |
Sul / Sudeste da Ásia | 8% | 14% |
América Latina | 4% | 17% |
O que significa tudo isso?
É importante entender como a precisão é medida e estar ciente dos erros inseridos nos dados. Mas mesmo que não seja 100% preciso os dados de cobertura vegetal GLAD ainda podem nos fornecer informações valiosas? Confira a Parte 2 dessa série de blog, onde vamos explorar o que todos esses números significam para os usuários dos dados GLAD.