Mémoire d'actuariat

Deterministic modelling of the subsidence risk in Metropolitan France
Auteur(s) JAMES M.
Société Willis Re
Année 2020
Confidentiel jusqu'au 15/12/2022

Résumé
Subsidence, caused by instabilities in the ground due to shrinkage and swelling of clayey soil, is a peril covered in France by all private property insurance covers which enters the scope of the French Natural Catastrophe regime. The past few years have seen this risk exacerbated by extreme heat waves and lack of rainfall in France, causing more and more subsidence claims, with little hope of this tendency stopping given the current climate change context. The inherent characteristics of subsidence make it a risk that is complex to model: it has slow kinetics and an absence of precise temporal definition, making subsidence models sparse on the market. The purpose of this study is to create a deterministic model that will allow for a first estimate of the annual number and cost of claims to be made. In order to achieve this, new climatic indicators are created base on soil temperature, soil humidity and precipitation, sourced from Open Data. "Classical" regression techniques, such as generalised linear models, are then tested in order to predict the annual number of claims. Other methods are also tested such as zero-inflated models, Random Forests and zero-altered Random Forests in an attempt to improve prediction by considering the particularities of the calibration data. These methods are compared and optimised based on their capacities of obtaining the best predictions.

Abstract
Le risque subsidence, dû à une instabilité du terrain causée par le retrait et gonflement des sols argileux, est un péril couvert en France par tous les contrats Multirisques-Habitation et qui s'inscrit dans le cadre du régime Catastrophes Naturelles français. Ces dernières années ont subi une sinistralité accrue entraînée par un manque de pluie et par des sécheresses extrêmes. Cette multiplication de sinistres liée à la subsidence semble être une tendance compte tenu du contexte actuel de dérèglement climatique. Les caractéristiques inhérentes à la subsidence en font un risque complexe à modéliser : ce sont des événements possédant une cinétique lente et n’ayant aucune délimitation temporelle précise, rendant les modèles subsidence peu fréquents sur le marché. L'objectif de ce mémoire est de créer un modèle déterministe permettant une première estimation du nombre et du coût de sinistres annuels dus à la subsidence. Pour ce faire, de nouveaux indicateurs climatiques sont créés sur la base de la température du sol, de l'humidité du sol et des précipitations, provenant d’Open Data. Des méthodes de régression classiques, telles que des modèles linéaires généralisés, sont ensuite implémentées dans le but d'estimer le nombre de sinistres annuels. Au-delà de modèles dits «classiques», d’autres méthodes plus innovantes sont ensuite testées, telles que des modèles Forêts Aléatoires simples et à inflation de zéros, permettant la prise en compte des particularités des données de calibrage. Ces modèles sont ensuite comparés et optimisés sur leurs capacités à obtenir les meilleures prédictions.