Mémoires d'Actuariat

Approche Machine Learning pour la prédiction des rachats en épargne
Auteur(s) CHANTELOUP V.
Société CNP Assurances
Année 2022
Confidentiel jusqu'au 12/07/2024

Résumé
En assurance épargne, l’option de rachat permet à l’assuré de retirer en partie ou en totalité le capital investi sur son contrat à tout moment, cela constitue un risque important pour l’assureur. Le risque de rachat est très complexe de par sa nature conjoncturelle et structurelle et il n’est pas toujours évident à modéliser par une approche actuarielle classique. En ce sens, une des interrogations en amont de ce travail s’est portée sur l’apport d’une approche par Machine Learning à l’estimation du risque de rachat par rapport à la modélisation classique des lois. L’idée retenue dans le cadre de ce mémoire est de proposer différentes approches pour prédire le moment où l’assuré serait le plus susceptible de racheter son contrat. La première approche consiste à développer un modèle pouvant prédire une durée jusqu’au rachat avec les informations disponibles à la souscription du contrat, grâce à l’appui d’algorithmes de Gradient Boosting dont certains pouvant prendre en compte les données censurées. Dans un second temps, l’étude a été élargie pour pouvoir prendre en compte les données de la vie du contrat. Une approche dans laquelle le but escompté est l’identification de manière individuelle du risque de rachat à court terme pour chaque contrat d’assurance-vie.

Abstract
In saving insurance, the possibility of surrender allows the policyholder to withdraw a part or all of the capital invested in the policy at any given time, and thus constitutes a significant risk for the insurer. Lapse risk is very complex due to its nature and is not always easy to model it using a traditional actuarial approach. To serve this purpose, one of the questions that arose in the early stages of this work concerned the contribution of a Machine Learning approach to the estimation of the lapse risk in relation to the classic law modelling. The idea behind this study is to offer different approaches to predict the moment when the insured is the most likely to surrender his policy. The first approach consists in developing a model that can predict a duration until the policy surrender, with the information available at contract subscription time thanks to the support of Gradient Boosting algorithms, some of which can take into account censored data. In a second step, the study was extended to consider data from the life of the contract. An approach in which the expected goal is the individual identification of the short-term lapse risk for each policy.