Mémoires d'Actuariat

Exploration des techniques de Machine Learning appliquées aux calculs de provisions Best Estimates
Auteur(s) MOMBO J. A.
Société CNP Assurances
Année 2022
Confidentiel jusqu'au 19/10/2024

Résumé
En assurance prévoyance, il existe un délai entre les dates de survenances et les dates de règlements de sinistres. Ce délai oblige les compagnies d’assurance à estimer une réserve de capital appelée Provision pour Sinistre A Payer (PSAP), au moment de l’arrêté comptable, afin de faire face à leurs engagements. Ces coûts futurs sont calculés à partir de différentes méthodes statistiques, dont la plus connue est la méthode de Chain-Ladder. Cette dernière suppose que les années de survenance sont indépendantes entre elles. De plus, le fait que les données soient agrégées rend difficile l’évaluation d’une provision à une maille plus fine. Ainsi, en dépit de ses avantages certains, cette méthode comporte aussi plusieurs limites. Le but de ce mémoire est donc d’explorer d’autres approches machine learning permettant de provisionner à des mailles plus micros, afin de disposer d’une meilleur évaluation Best Estimate (BE) des provisions, et d’améliorer le pilotage des activités, en détectant les facteurs de sinistralités les plus importants. Mots-clés : PSAP, Machine Learning, apprentissage supervisé, Régression, Fonction de perte, variables explicatives, Features, feature engineering, Open Data, Gradient, Hessien, Fonction de survie, Kaplan Meier, XGBSE, RMSEP, SHAP, One-Hot Encoding

Abstract
In life and health insurance, there is a delay between the accident date and claim dates. This delay requires insurance companies to estimate a capital reserve called Provision for Claims Payable, at the time of the closing accounts, in order to meet their commitments. These future costs are calculated using statistical methods. One of the most popular is the Chain-Ladder method. It assumes that the accidents years are independent of each other. In addition, in that model, the data is aggregated, so it is difficult to make provisions at a more micro-level. Thus, despite its clear advantages, this method also has several limitations. The goal of this paper is to explore other machine learning approaches that allow for more micro-level provisioning, in order to have a better Best Estimate (BE) evaluation of the provisions, and to improve the management of the activities, by detecting the most important damage factors. Key words : PSAP, Machine Learning, supervised learning, Regression, Loss function, explanatory variables, Features, feature engineering, Open Data, Gradient, Hessian, Survival function, Kaplan Meier, XGBSE, RMSEP, SHAP, One-Hot Encoding