Bienvenido
/
Casos de negocios
/
Rendimiento de los campos agrícolas
Seguros y Agritech

Rendimiento de los campos agrícolas

La filial climática de un líder asegurador francés necesitaba predecir los rendimientos de los campos en toda Alemania para fijar el precio de una nueva oferta de seguro contra sequías. Los datos internos no eran suficientes. Creamos los modelos predictivos que hicieron que el producto fuera comercializable.

Problema

El cliente lanzó una oferta de seguro paramétrico dedicada a los agricultores europeos, indexada a las condiciones de sequía. Para fijar el precio correcto, tenía que poder predecir los rendimientos de los campos por región y por tipo de cultivo en función de los niveles de humedad del suelo.

Problema: los datos internos eran insuficientes, las variables climáticas y geográficas necesarias estaban dispersas en docenas de fuentes heterogéneas de datos abiertos (Copernicus, ERA5, rásteres, shapefiles) y ningún modelo existente permitía hacer referencias cruzadas de estos datos para producir predicciones fiables a escala de todo un país.

Vue rapprochée d’une coupe transversale colorée d’une géode montrant des couches concentriques de minéraux en jaune, marron, rouge et vert.

Solución

Lo que construimos

Desplegamos un equipo de 2 científicos de datos y 1 científico de datos principal para diseñar un sistema predictivo completo en el perímetro alemán.

Paso 1 — Recopilación y enriquecimiento de múltiples fuentes Agregación de datos internos (clientes y socios comerciales) con múltiples fuentes de datos abiertos: datos satelitales (rásteres), límites geográficos (shapefiles), variables meteorológicas históricas (ERA5, Copernicus). Trabajo masivo de preparación y transformación para que estos datos heterogéneos puedan utilizarse en conjunto.

Paso 2 — Modelado predictivo Dos problemas tratados en paralelo: la predicción del rendimiento por región y por cultivo (regresión) y la detección de los años de sequía por región (clasificación). Compare varios enfoques (redes neuronales, LSTM, LSTM, Random Forest, Gradient Boosting, LightGBM) para identificar el modelo más eficiente para cada problema.

Paso 3 — Selección e implementación Se seleccionó Random Forest por su rendimiento óptimo. El modelo se implementó mediante una API REST con una capa de visualización en forma de mapas geográficos, lo que permitió a los equipos empresariales analizar las predicciones de rendimiento por área.

Proyectos de la misma categoría