Mémoire d'actuariat

Comportement de versement libre en épargne individuelle : approche conceptuelle et modélisation
Auteur(s) ANDRE S.
Société NATIXIS ASSURANCES
Année 2019
Confidentiel jusqu'au 10/07/2021

Résumé
Mots clés : Assurance Vie, Comportement d’épargne, Versements libres, Collecte, IFRS 17, Critères discriminants, Analyse Factorielle des Données Mixtes, Data Science, Machine Learning, Arbres de décision CART, Bagging, Boosting, RF, GBM, XGBoost, Segmentation. L‘Assurance Vie est le placement financier préféré des Français, en raison des multiples atouts qu’elle possède : sécurité, souplesse, disponibilité et fiscalité avantageuse entre autres. Les volumes mis en jeu et les mouvements permanents auxquels le marché est sujet : versements, arbitrages, rachats, représentent des enjeux considérables pour les assureurs. Dans le cadre du pilotage de l’activité, des exigences réglementaires et de l’analyse de la rentabilité prospective du portefeuille, anticiper les comportements d’épargne des assurés devient essentiel, en particulier les versements libres. Ces derniers désignent l’action volontaire de l’assuré d’alimenter son contrat d’épargne, à tout moment et sans limite de montant. Leur signal est faible et les montants concernés élevés : il s’agit du type de versement le plus difficile à prévoir. Un versement peut être motivé par la situation économique et financière ou expliqué par des caractéristiques de l’assuré et du contrat. Dans le premier cas, le versement est dit conjoncturel, dans le second, structurel. L’objectif de ce mémoire est de comprendre les raisons incitant les assurés à verser et de prédire ce comportement. Les travaux réalisés proposent une méthodologie de construction d’une loi comportementale, pour la modélisation des versements structurels d’une part et conjoncturels d’autre part. La modélisation des versements structurels s’est basée sur des méthodes d’apprentissage statistique permettant de détecter des relations complexes entre les facteurs de versement et d’effectuer des prédictions. Incontournable en première approche, la vision linéaire (analyse des corrélations, statistiques descriptives, Analyse Factorielle des Données Mixtes) a permis de déceler des premières tendances comportementales et d’effectuer une pré-sélection des variables à intégrer dans les modèles. Le schéma suivi est celui d’une décomposition décision * taux de versement libre, la décision de versement libre étant une variable binaire et le taux de versement un indicateur de l’amplitude du montant versé. Ces variables sont modélisées grâce à des arbres de décision CART et des méthodes d’agrégation de type bagging et boosting avec Random Forest, Gradient Boosting Machine et Extreme Gradient Boosting. Les modèles sont confrontés entre eux grâce à des métriques d’erreur, ce qui conduit à retenir celui présentant les meilleures performances pour chaque variable d’intérêt. Les modèles sélectionnés sont ensuite appliqués à des données récentes en guise de validation, étape commune de l’apprentissage statistique. On s’assure ainsi de la cohérence des résultats précédents et on observe l’évolution dans le temps du comportement de versement libre des assurés. Cette étape a permis de mettre en évidence la nécessité d’un ajustement des taux de versement, via une composante temporelle liée au cycle du produit. Une approche complémentaire de validation est testée, s’appuyant sur la segmentation optimale du portefeuille établie grâce aux algorithmes de Data Science et calibrée sur l’historique des observations passées. Les résultats du backtest sur 2018 sont jugés insatisfaisants, et l’analyse de l’écart est à mettre en lien avec la baisse des marchés financiers en 2018 qui n’a épargné quasiment aucune classe d’actif. Cette conclusion amène à la présentation de la seconde composante de la loi, à savoir les versements dynamiques. Si les facteurs explicatifs des versements conjoncturels sont nombreux, on propose de les modéliser en fonction de l’écart de rémunération entre le taux servi par l’assureur et le taux du Livret A. En effet, il a été constaté que le taux d’épargne financière des ménages est resté globalement constant alors que dans le même temps, le taux de versement observé était sur une tendance baissière. Disposant de la même richesse à épargner chaque année, on suppose ainsi que si les épargnants ne versent pas sur leur contrat d’assurance vie, c’est parce qu’ils privilégient les livrets bancaires dont le plus populaire est le Livret A. La synthèse de ce mémoire permet de tirer des conclusions sur la pertinence des approches de modélisation et des méthodes employées et avance des voies d’amélioration pour de potentiels futurs travaux.

Abstract
Keywords : Life Insurance, Savings behavior, Discretionary savings, Non-regular deposit, IFRS 17, Discriminating criteria, Factor Analysis of Mixed Data, Data Science, Machine Learning, CART decision trees, Bagging, Boosting, RF, GBM, XGBoost, Portfolio segmentation. Due to its many attractive points (security, flexibility, availability, tax breaks and many others), Life Insurance in France remains people’s favorite investment. Given the amounts committed within the sector and market movements : deposits, arbitrations, lapses, the stakes are clearly identified by the insurers. Business management, regulatory requirements and prospective profitability assessment require to predict how insured will deposit on their insurance contracts. Insured’ behavior will be taken into account for valuation purpose, especially non-regular deposits. A voluntary contribution is defined as the occasional action of the insured person to deposit into its savings contract, at any time and without any limit. They are few non-regular deposits and they involve large amounts, so they are the most difficult deposits type to predict. A deposit related to the intrinsic situation of each policyholder is called structural deposit. Other circumstances may lead to it, which is the case of exogeneous factors, such as economic or financial markets background. This kind of factors can lead to dynamic deposits. The purpose of this study is to understand and predict the decision and amount of saving. The underlying assumption is to present a methodology to get the saving behavior trend. Structural deposits modelling was based on statistical learning methods used to detect complex relationships between factors and to make predictions. First approach of data description and exploration was based on linear vision (correlation analysis, descriptive statistics, Factor Analysis of Mixed Data) in order to lead to a selection of variables to be included in the models. A decomposition decision*deposit rate approach will be adopted. Making at least one non-regular deposit on its contract is represented by the decision variable and the deposit rate refers to its amplitude. These target variables are modelled using CART decision trees and bagging and boosting aggregation methods with Random Forest, Gradient Boosting Machine and Extreme Gradient Boosting. Models are then compared with respect to error and performance metrics. The selected models are then applied to recent data as a validation. This common step in statistical learning ensures the consistency of previous results and shows the evolution over time of the insured behavior. This step brought to light a decrease in deposit rates in recent years, suggesting a time component adjustment, linked to the product cycle. A second validation approach is tested, based on the optimal portfolio segmentation established by the Data Science algorithms and calibrated on past observations. Hence, 2018 backtesting results are considered unsatisfying, the gap analysis highlighted the decline in financial markets that occurred in 2018. This leads to the introduction of the second component : dynamic deposits. Even if there are many factors implied, we suggest a model of dynamic deposits based on a gap between the insurer’s bonus rate and the “Livret A” rate. Indeed, the idea is that the rate of household savings in France remained constant while at the same time, deposit rate was declining. Therefore, while insured had the same amount of money to invest, if they did not choose their life insurance policy, it may be because they invested into savings accounts, the most popular being the “Livret A”. Finally, this paper synthesis suggests conclusions on the adequacy of the fitted models and improvement ways for potential future works.