Análise de Desmatamento e Produção Agrícola no Brasil

Período 2015–2021

Author

Jennifer Luz Lopes

1 Introdução

Este é um projeto de ciência de dados aplicado à análise da relação entre produção agrícola e desmatamento no Brasil (2015–2021), integrando dados do IBGE e INPE via BigQuery. Atuação em engenharia de dados, feature engineering temporal, análise estatística, modelagem preditiva com Random Forest, avaliação de modelos, análise espacial com sf/geobr, visualizações estáticas e interativas em R, com foco em sustentabilidade, eficiência produtiva e apoio à decisão.

1.1 Objetivos

  • Quantificar a relação entre produção agrícola (soja, milho, arroz) e desmatamento
  • Identificar municípios com maior risco ambiental
  • Desenvolver modelo preditivo para desmatamento
  • Mapear espacialmente padrões de eficiência produtiva

1.2 Metodologia

A análise integrou duas bases de dados principais através do BigQuery:

  • PAM/IBGE: Produção agrícola municipal de culturas temporárias
  • PRODES/INPE: Monitoramento de desmatamento por município e bioma

Foi desenvolvido um indicador de risco (risco_desmat_ton) que mede hectares de desmatamento por tonelada produzida, permitindo classificar municípios em três categorias: Baixo, Médio e Alto risco.

2 Análise descritiva

2.1 Visão geral dos dados

Mostrar código
library(readr)
library(dplyr)
library(knitr)
library(ggplot2)
library(scales)

# Carregar dados processados
df_completo <- read_csv("outputs/tables/dataset_integrado.csv", show_col_types = FALSE)
analise_risco <- read_csv("outputs/tables/analise_descritiva_por_risco.csv", show_col_types = FALSE)
analise_temporal <- read_csv("outputs/tables/analise_descritiva_temporal.csv", show_col_types = FALSE)
metricas <- read_csv("outputs/tables/metricas_modelo.csv", show_col_types = FALSE)
relatorio <- read_csv("outputs/tables/relatorio_execucao.csv", show_col_types = FALSE)

O dataset final integrado contém 30.554 observações de 5.277 municípios brasileiros ao longo de 6 anos (2015-2021).

Mostrar código
relatorio %>%
  kable(col.names = c("Item", "Valor"),
        align = c("l", "r"))
Table 1: Resumo da Execução do Projeto
Item Valor
Observações no dataset 30.554
Municípios únicos 5.277
Período analisado 2016-2021
Features utilizadas 9
MAE (hectares) 8,09
RMSE (hectares) 92,95
R² do modelo 0.992
MAPE (%) 1,1

2.2 Distribuição por classe de risco

Mostrar código
analise_risco %>%
  mutate(
    desmat_medio = format(round(desmat_medio, 0), big.mark = "."),
    desmat_mediano = format(round(desmat_mediano, 0), big.mark = "."),
    producao_media = format(round(producao_media / 1000, 1), big.mark = ".", decimal.mark = ","),
    producao_mediana = format(round(producao_mediana / 1000, 1), big.mark = ".", decimal.mark = ","),
    area_media = format(round(area_media, 0), big.mark = "."),
    produtividade_media = format(round(produtividade_media, 2), decimal.mark = ",")) %>%
  kable(
    col.names = c(
      "Classe de Risco",
      "Nº Municípios",
      "Nº Observações",
      "Desmat. Médio (ha)",
      "Desmat. Mediano (ha)",
      "Produção Média (mil ton)",
      "Produção Mediana (mil ton)",
      "Área Média (ha)",
      "Produtividade Média (ton/ha)"),
    align = c("l", rep("r", 8)))
Table 2: Estatísticas Descritivas por Classe de Risco
Classe de Risco Nº Municípios Nº Observações Desmat. Médio (ha) Desmat. Mediano (ha) Produção Média (mil ton) Produção Mediana (mil ton) Área Média (ha) Produtividade Média (ton/ha)
Baixo 1945 10083 678 292 123,5 41,2 30.173 4,43
Medio 2630 10388 500 231 5,5 1,9 1.970 3,20
Alto 2448 10083 510 270 0,3 0,1 352 1,64

2.2.1 Principais resultados

A classificação dos municípios revelou que:

  • Municípios de Alto Risco apresentam desmatamento médio de 510 hectares, significativamente superior às demais categorias
  • A produção média não necessariamente se correlaciona com maior desmatamento - municípios de Baixo Risco ainda produzem em média 123,5 mil toneladas
  • Existe variação substancial na eficiência produtiva: alguns municípios conseguem produzir mais com menor impacto ambiental

3 Evolução temporal

Mostrar código
# Normalizar valores para mesma escala
df_norm <- analise_temporal %>%
  mutate(
    desmat_norm = (desmatamento_total - min(desmatamento_total)) / 
                  (max(desmatamento_total) - min(desmatamento_total)) * 100,
    prod_norm = (producao_total - min(producao_total)) / 
                (max(producao_total) - min(producao_total)) * 100) %>%
  select(ano, desmat_norm, prod_norm) %>%
  tidyr::pivot_longer(
    cols = c(desmat_norm, prod_norm),
    names_to = "variavel",
    values_to = "valor") %>%
  mutate(
    variavel = recode(
      variavel,
      desmat_norm = "Desmatamento",
      prod_norm = "Produção Agrícola"))

ggplot(df_norm, aes(x = ano, y = valor, color = variavel)) +
  geom_line(linewidth = 1.3) +
  geom_point(size = 3.5) +
  scale_color_manual(
    values = c("Desmatamento" = "#7F1D1D", "Produção Agrícola" = "#3A5FA8"),
    name = NULL) +
  scale_x_continuous(breaks = seq(2015, 2021, 1)) +
  scale_y_continuous(labels = label_number(suffix = "%")) +
  labs(
    title = "Evolução Temporal: Desmatamento x Produção Agrícola",
    subtitle = "Valores normalizados (0-100%)",
    x = "Ano",
    y = "Índice Normalizado",
    caption = "Fonte: IBGE/PAM e INPE/PRODES") +
  theme_classic(base_size = 13) +
  theme(
    plot.title = element_text(face = "bold", size = 15),
    legend.position = c(0.85, 0.15),
    legend.background = element_rect(fill = "white", color = "gray80"),
    legend.text = element_text(size = 11),
    panel.grid.minor = element_blank())
Figure 1: Evolução do Desmatamento e Produção Agrícola (2015-2021)

3.1 Interpretação

A série temporal revela que, embora a produção agrícola tenha crescido consistentemente no período, o desmatamento apresenta maior volatilidade. Destaca-se uma redução no desmatamento entre 2019-2020, seguida de nova elevação em 2021.

4 Modelagem preditiva

4.1 Modelo Random Forest

Foi desenvolvido um modelo de Random Forest para predizer o desmatamento municipal com base em variáveis de produção agrícola, uso do solo e histórico de desmatamento.

As variáveis mais importantes para predição do desmatamento são:

  1. Desmatamento defasado (lag1 e lag2): O histórico recente é o melhor preditor
  2. Produção total: Forte associação com expansão de área
  3. Pressão sobre vegetação: Razão entre área cultivada e vegetação remanescente
  4. Área colhida: Indicador direto de expansão agrícola

4.1.1 Performance do modelo

Mostrar código
metricas %>%
  mutate(across(where(is.numeric), ~format(round(., 2), decimal.mark = ","))) %>%
  tidyr::pivot_longer(cols = everything(), names_to = "Métrica", values_to = "Valor") %>%
  kable(align = c("l", "r"))
Table 3: Métricas de Avaliação do Modelo
Métrica Valor
MAE 8,09
RMSE 92,95
R2 0,99
MAPE 1,1

O modelo apresenta:

  • R² = 0.992: Explica aproximadamente 99% da variação no desmatamento
  • MAE = 8.09 hectares: Erro médio absoluto moderado
  • MAPE = 1,1%: Erro percentual médio aceitável

5 Análise espacial

5.1 Relação Produção × Desmatamento

Mostrar código
knitr::include_graphics("outputs/figures/grafico_2_scatter.png")
Figure 2: Relação entre Produção Agrícola e Desmatamento por Classe de Risco

O gráfico de dispersão revela:

  • Heterogeneidade: Municípios com produção similar apresentam níveis muito distintos de desmatamento
  • Clusters de risco: Municípios de Alto Risco (vermelho) tendem a ter maior desmatamento mesmo com produção moderada
  • Oportunidades: Existem municípios de alta produção com baixo desmatamento relativo

6 Análise Espacial

6.1 Mapas Estáticos

6.1.1 Mapa 1 – Municípios com maior desmatamento

Identifica os municípios críticos que concentram o maior desmatamento absoluto, classificados por categoria de risco.

Este mapa evidencia os municípios que concentram o maior volume absoluto de desmatamento em 2021, permitindo identificar territórios críticos do ponto de vista ambiental.

6.1.2 Mapa 2 – Intensidade de desmatamento

Mapa coroplético mostrando a distribuição espacial da intensidade de desmatamento nos municípios acima do percentil 70.

A intensidade de desmatamento revela que parte significativa do impacto ambiental está concentrada em um subconjunto de municípios, reforçando a importância de políticas focalizadas.

6.1.3 Mapa 3 – Eficiência produtiva

Classifica municípios em quatro categorias de eficiência com base na relação desmatamento/produção, destacando os maiores produtores em cada categoria.

O mapa de eficiência produtiva demonstra que é possível alcançar elevados níveis de produção agrícola com menor impacto ambiental, evidenciando oportunidades de disseminação de boas práticas.

6.1.4 Mapa 4 – Produção e desmatamento por estado

Visão agregada estadual combinando intensidade de desmatamento (cor dos polígonos) com volume de produção (tamanho dos círculos).

A análise estadual permite visualizar padrões macroregionais, combinando intensidade de desmatamento e escala produtiva para apoiar decisões em nível estratégico.

6.2 Mapas: Versões interativas

As versões interativas em HTML permitem exploração detalhada e podem ser abertas via Browse:

  • outputs/maps/mapa_1_top_risco.html
  • outputs/maps/mapa_2_intensidade.html
  • outputs/maps/mapa_3_eficiencia.html
  • outputs/maps/mapa_4_estados.html

7 Considerações finais

  1. Heterogeneidade Regional: A relação entre produção agrícola e desmatamento varia substancialmente entre municípios, indicando que fatores locais (governança, fiscalização, tecnologia) são determinantes

  2. Eficiência é Possível: Existem municípios de alta produção com baixo desmatamento relativo, demonstrando que produção e conservação não são necessariamente incompatíveis

  3. Histórico Importa: O desmatamento passado é o melhor preditor do desmatamento futuro, sugerindo necessidade de intervenção em municípios com trajetória crítica

  4. Padrões Espaciais: O desmatamento se concentra em regiões específicas, permitindo priorização geográfica de políticas públicas

7.1 Recomendações

  • Políticas Diferenciadas: Municípios de Alto Risco necessitam intervenções mais intensivas
  • Disseminação de Boas Práticas: Estudar e replicar estratégias de municípios eficientes
  • Monitoramento Contínuo: Acompanhar municípios com histórico crítico e sinais de expansão
  • Incentivos à Intensificação: Promover aumento de produtividade em áreas já consolidadas

7.2 Limitações e próximos passos

Limitações:

  • Análise limitada ao período 2015-2021
  • Não considera outros fatores como pecuária, mineração e infraestrutura
  • Agregação municipal pode ocultar heterogeneidade interna

Próximos passos:

  • Incorporar dados de crédito rural e fiscalização ambiental
  • Análise de trajetórias individuais de municípios
  • Modelagem com variáveis climáticas e econômicas
  • Desenvolvimento de sistema de alerta precoce

8 Referências

  • IBGE: Produção Agrícola Municipal (PAM)
  • INPE: Programa de Monitoramento do Desmatamento na Amazônia Legal (PRODES)
  • Base dos Dados: Plataforma de integração de dados públicos brasileiros

Código completo: Disponível no script R: risco_desmatamento.R