Accueil
/
Business Cases
/
Rendement de parcelles agricoles
Assurance & Agritech

Rendement de parcelles agricoles

La filiale climatique d'un leader français de l'assurance avait besoin de prédire les rendements des champs à l'échelle de l'Allemagne pour tarifer une nouvelle offre d'assurance sécheresse. Les données internes ne suffisaient pas. Nous avons construit les modèles prédictifs qui ont rendu le produit commercialisable.

Problématique

Le client lançait une offre d'assurance paramétrique dédiée aux agriculteurs européens, indexée sur les conditions de sécheresse. Pour la tarifer correctement, il devait être capable de prédire les rendements des champs par région et par type de culture à partir des taux d'humidité au sol.

Problème : les données internes étaient insuffisantes, les variables climatiques et géographiques nécessaires étaient dispersées dans des dizaines de sources Open Data hétérogènes (Copernicus, ERA5, rasters, shapefiles), et aucun modèle existant ne permettait de croiser ces données pour produire des prédictions fiables à l'échelle d'un pays entier.

Vue rapprochée d’une coupe transversale colorée d’une géode montrant des couches concentriques de minéraux en jaune, marron, rouge et vert.

Solution

Ce que nous avons construit

Nous avons déployé une équipe de 2 Data Scientists et 1 Lead Data Scientist pour concevoir un système prédictif complet sur le périmètre de l'Allemagne.

Étape 1 — Collecte et enrichissement multi-sources. Agrégation des données internes (partenaires commerciaux du client) avec de multiples sources Open Data : données satellitaires (rasters), délimitations géographiques (shapefiles), variables météorologiques historiques (ERA5, Copernicus). Un travail massif de préparation et de transformation pour rendre ces données hétérogènes exploitables ensemble.

Étape 2 — Modélisation prédictive. Deux problèmes traités en parallèle : prédiction du rendement par région et par culture (régression), et détection des années de sécheresse par région (classification). Benchmark de multiples approches — réseaux de neurones, LSTM, Random Forest, Gradient Boosting, LightGBM — pour identifier le modèle le plus performant sur chaque problème.

Étape 3 — Sélection et déploiement. Le Random Forest a été retenu pour ses performances optimales. Le modèle a été déployé via API REST avec une couche de visualisation sous forme de heatmaps géographiques, permettant aux équipes métier de naviguer dans les prédictions de rendement par zone.

Projets dans la même catégorie