Mémoire d'actuariat

Mortality risk modeling with machine learning
Auteur(s) MARTIN L.
Société SCOR
Année 2020

Résumé
L’avènement de l’intelligence artificielle en assurance ne se limite pas à l’automatisation de la souscription ou au développement de chabots. Cette dernière peut aussi être utilisée pour le cœur même du métier de l’assureur : l’amélioration de sa connaissance du risque. La consolidation des systèmes d’information permet aux assureurs et réassureurs d’accroitre leur efficacité en interne et d’analyser des bases de données plus riches. L’industrie de l’assurance de personnes commercialise des contrats pour couvrir les accidents corporels, l’invalidité, la maladie ou encore le décès. Une bonne compréhension des risques biométriques est donc essentielle pour maximiser la prospérité d’une compagnie et proposer le tarif adéquat à chaque assuré. Pour cela, il est intéressant d’aller au-delà des méthodes statistiques traditionnelles et de faire appel aux modèles de Machine Learnig Ces derniers ont souvent de bonnes performances par leur capacité à exploiter pleinement l’information contenue dans les bases de données volumineuses. Si pour l’évaluation du risque mortalité, les modèles de durée ont prouvé leur efficacité, les modèles de Machine Learnig pourraient permettre d’aller plus loin. Ils n’ont pas été initialement conçus pour modéliser des durées, et ne peuvent pas être appliqués tels quels aux données de survie. Il est donc légitime de se demander dans quelle mesure les algorithmes de Machine Learnig pourraient prendre en compte les spécificités de l’étude de la survie. Ce mémoire propose une étude théorique approfondie des adaptations de certains modèles de Machine Learnig pour l’évaluation du risque de mortalité. Les aspects métiers de l’assurance vie, des explications concrètes de sensibilité sur les produits, ainsi que des réflexions autour des avantages et inconvénients dans l’utilisation des modèles sur un marché d’assurance concurrentiel sont présentées.

Abstract
The use of artificial intelligence in insurance is not limited to automate underwriting or develop chatbots. It can also be used for the very heart of the insurer’s business: improving the knowledge of risk. Indeed, consolidating information systems enables insurers and reinsurers to increase their internal efficiency and to analyze larger databases. The life and health insurance industry sells contracts to cover individuals against bodily injury, disability, illness, or death. A good understanding of biometric risks is essential to maximize a company’s prosperity and to offer the right price to each person insured. To achieve this, it is worth going beyond traditional statistical methods and using Machine Learning models. These have often good predictive performance due to their ability to fully exploit all the information contained in large databases. While duration models have proven their effectiveness for assessing mortality risk, Machine Learning models could be used to go further. They have not initially been designed for survival modeling purposes and, contrary to other topics, they cannot be transposed as is to survival data. It is thus legitimate to wonder to what extent Machine Learning algorithms could be adapted and take into account the specificities of survival study. This master thesis proposes an in-depth theoretical study of the adaptations of certain Machine Learning models for mortality risk assessment. Business aspects of life insurance are also addressed. Concrete explanations of product sensitivities as well as reflections on the advantages and disadvantages in the use of the models in a competitive insurance market are presented. The results of the numerical application are derived from the use of the American NHANES mortality database. All the methods presented in this master thesis are available in a library developed in Python.

Mémoire complet