Mémoires d'Actuariat

Fairness, interprétabilité et maîtrise des risques en tarification non-vie
Auteur(s) MONTMEAT F.
Société Optimind
Année 2021
Confidentiel jusqu'au 17/03/2023

Résumé
L’émergence de nouvelles méthodes d’apprentissage statistique a remis en cause la tarification classique en assurance. Dans un monde toujours plus concurrentiel, proposer le tarif le plus adapté à chaque assuré est devenu primordial. Aujourd’hui, les GLM ne répondent donc plus forcément à ces contraintes. Ce mémoire s’intéressera à la tarification de la garantie dégât des eaux d’un contrat MRH par un modèle fréquence/coûts. La première partie de ce mémoire consistera à choisir le meilleur modèle possible pour la prédiction de la fréquence et des coûts. Les GLM seront conservés en point d’appui pour les comparer aux modèles de machine learning. Dans un second temps, les modèles de machine learning étant jugés ininterprétables et "boites noires", il s’agira de les défendre en répondant aux critères d’explicabilité, de transparence, d’interprétabilité et de loyauté souhaités par les décideurs, les régulateurs et les assurés. Pour cela, des méthodes de transparence telles que les valeurs shapley et les ALE-plot seront utilisées. L’idée de ce mémoire est donc de rendre transparent les modèles « boites noires » par l’utilisation de sur-modèles aussi bien au niveau local que global. L’objectif est de mesurer les avantages et inconvénients de passer de l’ancien modèle au nouveau modèle. Mots-clés : Assurance multirisque habitation (MRH), Tarification, Gradient boosting, Forêts aléatoires, Transparence, Interprétabilité, Explicabilité, Valeurs Shapley, ALE, GLM

Abstract
The emergence of new machine learning methods has challenged traditional insurance pricing. In an increasingly competitive world, it has become essential to offer the most appropriate premium for each policyholder. Today’s GLM models no longer necessarily meet these constraints. This paper will focus on the pricing of water damage coverage in an home insurance contract using a frequency/cost model. The first part of this paper will be to select the best possible model for frequency and cost prediction. The GLM will be kept as a basis for comparison with the machine learning models. Secondly, since machine learning models are considered to be uninterpretable and "black boxes", it will be a matter of defending them by meeting the criteria of explicability, transparency, interpretability and loyalty desired by decision-makers, regulators and policyholders. For this, transparency methods such as shapley values and ALE-plot will be used. The idea of this paper is therefore to make "black box" models transparent through the use of over-models at both local and global levels. The objective is to measure the advantages and disadvantages of switching from the old model to the new one. Keywords : Home insurance, Pricing, Gradient boosting, Random forest, Transparency, Interpretability, Fairness, Shap values, ALE, GLM

Mémoire complet