Mémoire d'actuariat

Modélisations du risque de résiliation dans un portefeuille de santé individuelle
Auteur(s) VALLA Mathias
Société Axéria Prévoyance
Année 2018
Confidentiel jusqu'au 06/02/2020

Résumé
Nous nous attachons, dans ce mémoire, à étudier le risque de résiliation dans un portefeuille en santé individuelle. Après avoir analysé le contexte de notre étude, à différents niveaux, nous nous penchons sur diverses approches visant à mieux appréhender ce risque. Ainsi, nous étudions d'abord les évolutions mensuelles et annuelles des taux de résiliation pour pouvoir établir des hypothèses de chutes dans les trois premières années de la vie d'un produit, avant sa phase de commercialisation. La théorie des séries temporelles avec notamment les modèles de lissage exponentiel ou les modèles ARIMA ou ARIMAX nous permet de mener à bien cette étude et nous délivre des résultats cohérents et satisfaisants. Ensuite, nous nous intéressons à la surveillance des comportements de résiliation au sein d'un portefeuille actif. Nous calibrons des modèles capables de donner, pour chaque individu du portefeuille, une probabilité de résilier son contrat durant l'année en cours en utilisant les outils de l'apprentissage automatique: le Machine Learning. Cette approche nous permet de développer deux outils. Le premier se sert de ces prévisions individuelles pour obtenir un taux de chute annuel global. Le second est construit pour discriminer les profils d'adhérent les plus à même de résilier leur contrat afin de pouvoir agir sur leurs comportements en établissant une politique de rétention adéquate. D'une manière générale, nous nous attachons à essayer de comprendre les mécanismes régissant le comportement de résiliation dans notre portefeuille. L'apprentissage automatique, et notamment le Gradient Boosting, nous permet d'obtenir des résultats très encourageants concernant notre problématique de rétention, mais des résultats décevants pour obtenir un taux de résiliation annuel global.

Abstract
In this master thesis, we focus on the risk of termination in a portfolio in individual health insurance portfolio. After analyzing the context of our study, at different levels, we try various approaches to get a better understanding of this risk. Thus, we first study the monthly and annual evolutions of churn rates in order to be able to establish attrition hypotheses concerning the first three years of a product's life, before its commercialization phase. Time series theory, including the exponential smoothing models or the ARIMA or ARIMAX models, allows us to carry out this study and delivers consistent and satisfactory results. Then, we focus on monitoring churn behaviors within an active portfolio. We calibrate models that gives a probability of terminating their contract during the current year to each contract holder by using Machine Learning. This approach allows us to develop two tools. The first one uses these individual probabilities to predict an overall annual churn rate. The second one aims at discriminating the contract holders that are most likely to terminate their contract, in order to take an action regarding their behavior by establishing an adequate retention strategy. In general, we focus on trying to understand the mechanisms governing the churn behaviors. Machine learning, especially Gradient Boosting, allows us to get very encouraging results concerning our retention problem, but gives us disappointing results concerning the prediction of a global annual attrition rate.