Mémoires d'Actuariat

Les apports du Machine Learning dans le provisionnement non vie
Auteur(s) EYRAUD S.
Société AxaXL
Année 2022

Résumé
Les méthodes classiques de provisionnement, telles que Chain Ladder et Bornhuetter Ferguson, demeurent largement utilisées par les assureurs. Mais de nouvelles techniques basées sur l’apprentissage statistique automatisé ont fait leur apparition ces dernières années dans la littérature actuarielle. Cette étude se propose d’en explorer les apports pour le provisionnement ligne à ligne de la branche dommage d’AxaXL. La première partie est consacrée à la nécessaire préparation des données (chapitre 1). Les principales méthodes de provisionnement seront ensuite étudiées : agrégées d’abord (chapitre 2) puis celles issues de l’apprentissage statistique automatisé (chapitre 3). La modélisation du problème ligne à ligne ainsi que les contraintes qui en découlent y seront exposées et une application concrète sera conduite pour chaque algorithme. Enfin, les dernières techniques d’interprétabilité seront expliquées et appliquées (chapitre 4), ce qui permettra d’identifier les variables explicatives ayant contribuées le plus à la prédiction de la charge totale. Les résultats de l’étude confortent la position de leader du Chain Ladder mais identifient des pistes intéressantes pour la prédiction des développements lointains avec le XGBoost. Mots clés : non vie, apprentissage statistique automatisé, machine learning, dommage, branche courte, provisionnement ligne à ligne, Python.

Abstract
Aggregated reserving methods, such as Chain Ladder and Bornhuetter Ferguson, continue to be widely used across the insurance industry. But state of the art technics based on Machine Learning emerged a few years back in the actuarial literature. This study aims at exploring what they can bring to the table for the transactional (line by line) reserving of the Property line of business in AxaXL, starting with the necessary data engineering (chapter 1). The most iconic methods will then be reviewed: the aggregated ones first (chapter 2), then those emanating from the Machine Learning world (chapter 3). The line by line modelling along with its constraints will be touched on and practical application will be carried out for each. Lastly, the latest interpretability methods will be explained & applied to the dataset (chapter 4), which will lead to the identification of the most useful variables in predicting the ultimate loss reserve. The study confirms the undisputed status of the Chain Ladder but unveils interesting takeaways from the XGBoost when it comes to predicting development years farther in time. Key words: non life, Machine Learning, Property, short tail, individual reserving, Python.

Mémoire complet