Mémoires d'Actuariat

Mortality level estimation for annuities and underwritten annuities products combinig traditional and Machine Learning technics
Auteur(s) GERONDEAU A.
Société Scor
Année 2022
Confidentiel jusqu'au 14/03/2024

Résumé
La segmentation du risque a toujours été un sujet important pour les compagnies d'assurance afin de se prémunir contre l'antisélection. Les modèles utilisés pour estimer le risque deviennent ainsi de plus en plus complexes et contiennent de plus en plus de variables. Dans le cas d'un nombre élevé de variables explicatives, les méthodes traditionnelles telles que le modèle linéaire généralisé (GLM) ne sont pas adaptées à la prise en compte d'effets d'interactions complexes, et donc l'incertitude peut subsister sur l'efficacité de ces modèles. Nous avons constaté au cours des dernières années une utilisation croissante des modèles de Machine Learning dans une grande variété de domaines. La tentation d'utiliser ces modèles puissants dans le secteur de l'assurance ne fait pas exception. Cependant, les compagnies d'assurance sont confrontées à des contraintes réglementaires, les obligeant à être en mesure d'expliquer leurs tarifs. Par conséquent, l'utilisation des modèles d'apprentissage automatique est souvent limitée. Notre étude montre un moyen d'utiliser des modèles de Machine Learning pour superviser les performances de calibrage et de segmentation des modèles GLM traditionnels, à travers l'exemple de l'estimation du risque de niveau de mortalité par de nombreuses variables relatives à l'état de santé pour des produits de rente sur risque aggravé. Notre étude est basée sur des données de santé britanniques provenant de la base de données THIN. Nous montrons que, en tirant parti des connaissances d'experts médicaux ainsi que des informations fournies par l'analyse de sensibilité d'un modèle d'apprentissage automatique, il est possible d'avoir des performances prédictives proches entre un modèle linéaire généralisé et un modèle d'apprentissage automatique. Nous montrons également comment tirer parti de la forme linéaire du modèle linéaire généralisé afin d'expliquer et de comparer les prédictions.

Abstract
Segmentation of the risk has always been of important topic for insurance companies to prevent themselves from adverse selection. Models used to estimate the risk are becoming more and more complex and exploit more and more variables. Traditional methods such as Generalized Linear Model are not adapted to capture interaction effects within numerous input variables, and therefore uncertainty can remain in the efficiency of the fitted models. We have seen in the past years an increasing use of Machine Learning models in a large variety of fields. Temptation to use those complex models in the insurance industry is no exception. However, insurance companies are faced with regulation constraints, requiring them to be in the capacity to explain their predictions. Therefore, the use of Machine Learning models are often limited. This study shows a way to use Machine Learning models to supervise the calibration and segmentation performance of traditional Generalized Linear Model models, through the example of mortality level risk estimation using health status variables for enhanced annuity products. Our study is based on UK health data originating from THIN database. We show that, when taking advantage of knowledge from medical experts as well as insights provided by sensibility analysis of a Machine Learning model, it is possible to have close predictive performances between a Generalized Linear Model and a Machine Learning model. We also show how to take advantage of the linear form of the Generalized Linear Model in order to explain and compare predictions.

Mémoire complet