Mémoires d'Actuariat

Risque de subsidence, prédiction via méthodes de machine learning et l'Open Data
Auteur(s) ZHAN F.
Société Liberty Mutual Re
Année 2021
Confidentiel jusqu'au 15/11/2023

Résumé
Ce mémoire d'actuariat réalisé au sein de l'équipe Agriculture & Parametrics de Liberty Mutual Re porte sur l'étude du risque de subsidence. Plus précisément, nous nous intéressons au phénomène de retrait-gonement des argiles et aux conséquences de ce dernier sur les constructions. L'objectif de ce projet est de modéliser et prédire la charge IBNR totale nationale des sinistres de sécheresse d'une année dès lors que cette dernière s'achève, à l'aide des variables dérivant des données climatiques, des données géologiques et des données socio-économiques. La connaissance rapide de la charge IBNR permet notamment une meilleure gestion des provisions et une allocation plus ecace des capitaux propres pour les assureurs. Les variables climatiques, construites à partir des indices de sécheresse serviront à caractériser de manière quantitative la situation de sécheresse propre à chaque année. Les indices de sécheresse sollicités, basés sur des données de précipitation et de température, sont d'abord utilisés au cours d'une approche annuelle avec une résolution spatiale départementale. Cette approche a pour objectif d'introduire le sujet, son contexte et les données. Lors de cette dernière, nous explorons les données à l'aide des outils d'analyse en composantes principales et des modèles basés sur la théorie des modèles linéaires généralisés. Cette première approche montre rapidement ses limites en raison de la résolution de la maille utilisée qui réduit drastiquement le nombre d'observations. Pour répondre à cela, nous anons l'approche pour passer d'une approche départementale à une approche communale. Cette dernière, moyennant une modélisation en deux étapes dite occurrence-fréquence et à l'aide des méthodes de machine learning, nous a notamment permis de développer toute une méthodologie autour de la sélection des variables explicatives et la construction des modèles. Les résultats de cette approche avec l'introduction d'une fonction déterministe à la sortie du modèle occurrence-fréquence sont très prometteurs. Néanmoins, ces résultats doivent être complétés en raison de la publication des données d'indice SWI Uniforme ou Uniforme Soil Moisture Index par Météo-France en avril 2021. Les nouvelles données nous invitent à mettre à jour le modèle d'occurrence mais surtout à développer un modèle saisonnier avec chaque modèle sous-jacent décrivant une saison particulière. Ce modèle saisonnier, réalisé à l'aide de la théorie des modèles inatés, produit des résultats satisfaisants tout en mettant en évidence un manque de diversité dans les données annuelles et un manque de données pour certaines saisons. Ces limites, parfois inhérentes à la mise en application récente des nouveaux critères de reconnaissance, peuvent néanmoins être rapidement surmontées dans les années à venir.

Abstract
The internship completed within the Agriculture & Parametrics team of Liberty Mutual Re studies the risk of subsidence, a geological phenomenon. More precisely, we are interested in the shrinking and swelling of clays and its consequences over buildings. The aim of this project is to model and predict the national IBNR amount of claims at the end of a given year, with variables extracted from climate data, geological data and socioeconomic data. The quick access of IBNR amounts of claims allows a better management of provisions and a more ecient equity allocation for insurers. The climate variables, derived from classic drought indices, aim to characterize quantitatively the drought situation of each year and the geological and socioeconomic variables will help us measure the severity of drought in terms of claims. The drought indices, based on precipitation and temperature data, are rst used in a regional approach which aims to introduce the subject, its context and the data. With this approach, we explored the data using principal components analysis and models based on the generalized linear model framework. This rst approach shows its limits mainly due to the regional resolution which drastically reduces the number of observations. To override these limits, we used a local approach with which, thanks to a two-step modelling process and machine learning techniques, we developed a whole methodology about feature selection and model development. The results obtained from this approach, by applying a deterministic function to the outcome of the two-step model, were really promising. Nonetheless, they were also incomplete due to the data of Uniform SWI or Uniforme Soil Moisture Index published by Météo-France in April 2021. These new data invite us to update a part of the two-step model but also to develop a seasonal model which combines four underlying models, one for each season. The seasonal model was developed using the inated model framework and its results were satisfying despite the lack of diversity in the annual data and the lack of data for some seasons. Nonetheless, these lacks, inherent to the application of newly dened recognition criteria of natural disaster in 2018, may be overridden in the near future.

Mémoire complet