Mémoires d'Actuariat

Apport du Machine Learning dans l'analyse multivariée de la sinistralité des contrats emprunteur
Auteur(s) NIAKH F.
Société CNP Assurances
Année 2022
Confidentiel jusqu'au 17/03/2024

Résumé
Le contrat d'assurance emprunteur est un contrat temporaire, limité à la durée du prêt. Il permet de couvrir un emprunteur contre un risque d'insolvabilité à la suite de la survenance d'un sinistre tel que le Décès (DC), l'Incapacité de Travail (IT) ou la Perte d’Emploi (PE). Ainsi, une connaissance approfondie de ces risques est essentielle pour l'assureur afin que les primes collectées par ce dernier puissent couvrir les futurs sinistres inconnus. Dans ce mémoire, nous avons analysé et quantifié ces risques en maille fine en faisant appel aux méthodes de Machine Learning. Nous avons commencé par segmenter notre portefeuille par scoring avec la régression logistique. Les variables binaires de DC et d'entrée en IT sont utilisées à cet effet. Ensuite, pour le risque DC, nous avons mis en place une loi d'expérience de maintien en vie dans le prêt. Nous avons utilisé trois approches de modélisation : Cox, XGBoost Cox et XGBoost survival embedding (Xgbse). Pour ce qui est du risque IT, nous avons modélisé les prestations en adoptant trois approches : Tweedie, XGBoost et les Réseaux de neurones. En combinant les résultats issus de la modélisation sur le DC et l'IT, nous avons pu proposer des méthodes alternatives de provisionnement et de calcul de rentabilité dans le portefeuille. Cette étude révèle que l'hypothèse du modèle de Cox selon laquelle les risques sont proportionnels n'est pas vérifiée par nos données. Ainsi, le modèle Xgbse est utilisé pour la construction de notre table de maintien. L'analyse des résultats de ce dernier laisse entrevoir que les variables les plus importantes pour l'explication du risque de mortalité sont : l'âge à la souscription, la durée du prêt et le sexe. Les résultats de la modélisation des prestations IT montrent que le modèle XGBoost affiche des meilleures performances. En outre, le capital assuré, la durée du prêt et la tranche d'âge [45; 55 ans) sont les facteurs les plus déterminants. Mots clés : Assurance emprunteur, Cox, Xgbse, Tweedie, XGBoost, Réseaux de neurones

Abstract
Mots clés : Assurance emprunteur, Cox, Xgbse, Tweedie, XGBoost, Réseaux de neurones Loan insurance contract is a temporary contract, limited to the duration of the loan. It covers a borrower against the risk of insolvency following the occurrence of a claim such as death, disability or loss of employment. Thus, a deep knowledge of these risks is essential for the insurer so that the premiums collected by the latter can cover future unknown claims. In this master thesis, we have analyzed and quantified these risks in fine mesh using Machine Learning methods. We started by segmenting our portfolio by scoring with logistic regression. The binary variables of death and disability entry are used for this purpose. Afterwards, for mortality risk, we established a survival law of experience in the loan. We used three modeling approaches: Cox, XGBoost Cox and XGBoost survival embedding (Xgbse). For work disability risk, we modeled claims using three approaches: Tweedie, XGBoost and Neural Networks. By combining the results from death and disability modeling, we were able to propose alternative methods of reserving and calculating profitability in the portfolio. This study shows that the assumption of the Cox model regarding proportional risks is not verified by our data. As a result, the model Xgbse is used to construct our survival law of experience in the loan. Analysis of the results of the latter suggests that the most important variables in explaining mortality risk are: age at underwriting, loan duration and gender. The results of the modeling of work disability claims show that the model XGBoost performs better. In addition, the sum insured, the loan duration and the age range [45; 55 years] are the most important contributors. Keywords: Loan insurance, Cox, Xgbse, Tweedie, XGBoost, Neural Networks

Mémoire complet