Mémoire d'actuariat

Analyse technique des résiliations dans le cadre de rétention commerciale
Auteur(s) BREFORT Manon
Société April Santé Prévoyance
Année 2018
Confidentiel jusqu'au 15/05/2020

Résumé
L'analyse descriptive du portefeuille a été appuyée par l'usage complémentaire de deux modélisations. La régression logistique est un modèle à la fois explicatif par la création d'une grille de score et de prédictif par l'estimation des probabilités de résiliation de chaque adhérent. Dans la grille de score, la résiliation est d'autant plus probable que le nombre de points sera conséquent. La régression logistique est la seule grande concurrente de la méthode CART. Les arbres de décision sont d'ailleurs à la frontière entre les méthodes prédictives et descriptives puisque la classification s'opère par segmentation. Les inconvénients majeurs des arbres sont leur manque de fiabilité et de robustesse. C'est pourquoi l'utilisation des forêts aléatoires en tant que modèle prédictif s'avère être une meilleure décision en raison de leur double randomisation. A partir des probabilités de résiliation estimées, un seuil sera établi afin de sélectionner de manière optimale les adhérents dans le processus de fidélisation. Les gestionnaires seront informés de la possible résiliation des adhérents ayant une probabilité plus élevée que le seuil et pourront proposer une réduction viagère si nécessaire. Afin de visualiser l'impact de la rétention déjà existante sur la durée d'adhésion, les courbes de survie des contrats avec rétention et sans rétention seront estimées à l'aide de l'estimateur de Kaplan-Meier. Cet impact pourra être quantifié par le modèle de Cox si les hypothèses du modèle son respectées.

Abstract
A descriptive analysis of our portfolio is supported by complementary use of two modeling. The logistic regression is a model both explanatory (by creating scorecards) and predictive (by estimating probability termination of the subscriber). In scorecards, termination is more probable as the number of points is high. The logistic regression is the only contender of the CART trees method. Decisions trees are on the borderline between the prediction and the descriptive methods since the classification occurs by segmentation. The main drawbacks of decisions trees are the lack of reliability and robustness. Therefore, random forest's use in prediction model seems to be the best decision because of a double randomization. A threshold based on results of estimated probabilities is determined in order to select optimally members in customer retention. Operators will be alerted about the signs of contract's termination when the score is higher than the threshold. During a survey in 2017, a majority of brokers had emitted reserves on the process of retention. The survival curves of contracts with and without loyalty program will be estimate with Kaplan-Meier estimator in order to visualize the impact of the loyalty program on the duration of the membership. This impact can be quantified by the model of Cox if the hypotheses of the model are respected.