Mémoire d'actuariat

Application des méthodes d'apprentissage à la tarification non-vie et considérations sur l'interprétabilité
Auteur(s) DEBARD Jean-Baptiste - LI Diane
Société Société Générale
Année 2019
Confidentiel jusqu'au 30/09/2021

Résumé
Les méthodes récemment développées de machine learning sont en passe de transformer l'industrie de banque-assurance. Ces méthodes semblent présenter d'indéniables gains de performances par rapport aux méthodes classiques pour de nombreuses applications et permettent d'explorer de nouvelles possibilités. Elles introduisent néanmoins une nouvelle complexité dans la mise en place d'un dispositif de contrôle afin de mesurer et mitiger le risque de modèle. Aujourd'hui, banques et assureurs opèrent dans un contexte légal strict, et le cadre réglementaire européen s'inspire de plus en plus de la gouvernance appliquée aux US sur le risque de modèle, décrite dans la lettre FED SR 11-7. Malgré des bases solides, cette gouvernance couvre insuffisamment les nouveaux risques inhérents aux modèles de machine learning, en particulier sur la question de leur interprétabilité. Dans ce mémoire, nous nous intéressons à cette nouvelle famille de modèles avec un double objectif. Dans ce premier temps, nous cherchons à évaluer l'apport des méthodes de machine learning en les appliquant sur la tarification d'une garantie d'assurance Multi-risque Habitation (dégât des eaux). Nous présentons donc trois méthodes d'apprentissage avancées largement utilisées (Forêt Aléatoire, XGBoost et perceptron multicouche via Tensorflow) et les comparons avec l'approche classique en Modèle Linéaire Généralisé (GLM). Dans un second temps, nous menons une réflexion sur notre capacité à maîtriser le risque de modèle. A ce titre, nous avons utilisé les méthodes d'interprétation locales développées tout dernièrement LIME et SHAP.

Abstract
Machine learning models are about to deeply transform the industry of banking and insurance. These approaches became predominant as they shw undeniable performance gains compared to conventional approaches for many applications and allow one to explore new usages. They, however, generate a new complexity in their control and increase model risk. Indeed, banks and insurance companies operate within a strict legal framework and need to set up control and validation processes to measure and mitigate the risks on models they use. Currently, most banks follow the US regulation whose guidelines are detailed in the letter SR 11-7 and the French regulator is pushing toward this direction as well in its supervision of insurance companies. Despite this governance setting sound foundations, it does not sufficiently address the new sources of model risk induced by this surging family of models. Among risks newly introduced by machine learning approaches, the interpretability of these black-box models and control over their potential biases are the main challenges. With these issues in mind, the objective of our thesis is twofold: First, we try to evaluate the benefits of using machine learning models in pricing a multi-risk home insurance policy (water damage risk only). Then, we focus on our ability to analyze and control said machine learning black box models, through local interpretation approaches while also addressing whether an appropriate control framework can be set up when such models are developed.