• Flickr Governo de São Paulo
  • Linkedin Governo de São Paulo
  • TikTok Governo de São Paulo
  • Twitter Governo de São Paulo
  • Youtube Governo de São Paulo
  • Instagram Governo de São Paulo
  • Facebook Governo de São Paulo
  • /governosp

Estimativa de produtividade na cana de açúcar com base em dados NDVI – Índice de Vegetação por Diferença Normalizada

Resumo

A estimativa antecipada da produtividade da cana-de-açúcar (TCH) é uma ferramenta estratégica crucial para o planejamento logístico e tomada de decisão no setor sucroenergético. Contudo, a complexidade dos dados de sensoriamento remoto, especialmente séries temporais de índices de vegetação, apresenta desafios significativos como a alta dimensionalidade. Diante disso, o presente trabalho realizou um estudo exploratório para avaliar um fluxo de trabalho de mineração de dados (Orange) para a predição da TCH, focando na otimização de atributos temporais de NDVI e SAVI através da Análise de Componentes Principais (PCA). Utilizando um conjunto de dados de campo extremamente restrito (N=11) do cultivar RB975242 no município de Parapuã - SP, o fluxo aplicou a PCA para reduzir 64 atributos temporais a 4 componentes principais, que explicaram 92,6% da variância. Em uma validação cruzada Leave-One-Out (LOOCV), o modelo de Regressão Linear Múltipla (MLR) alcançou métricas de desempenho aparentemente excepcionais (R² = 0.965; CVRMSE = 4,47%; RMSE = 4.93). No entanto, uma análise crítica da metodologia revelou uma severa falta de robustez. Testes de sensibilidade demonstraram que o desempenho do modelo é altamente instável e dependente do conjunto exato de atributos, caracterizando um forte indício de superajuste (overfitting), exacerbado pelo tamanho limitado da amostra. Conclui-se que, embora o fluxo (PCA + MLR) demonstre potencial teórico, o modelo gerado carece de capacidade de generalização e não pode ser considerado uma ferramenta preditiva confiável. O principal resultado deste estudo serve como um alerta sobre os riscos críticos do overfitting na aplicação de machine learning em datasets agrícolas com amostragem insuficiente, reforçando a necessidade indispensável de validação em bancos de dados substancialmente maiores.

Descrição

Citação

LOURENÇO, Patrick Pratis dos; PRADO, Marcus Vinicius de Oliveira. Estimativa de produtividade na cana de açúcar com base em dados NDVI – Índice de Vegetação por Diferença Normalizada, 2025. Trabalho de conclusão de curso (Curso Superior de Tecnologia em Mecanização em Agricultura de Precisão) - Faculdade de Tecnologia FATEC Shunji Nishimura (Pompéia), Pompéia, 2025.

Avaliação

Revisão

Suplementado Por

Referenciado Por

Governo do Estado de SP