Mémoires d'Actuariat

Méthode alternative de tarification santé : GLM/XGBOOST
Auteur(s) AKAFFOU D.H.
Société PwC
Année 2020

Résumé
En France, le marché de l'assurance santé est un marché très concurrentiel avec des réformes qui protègent de plus en plus les assurés. Cela contraint les assureurs à optimiser leurs modèles de tarification afin d’être plus compétitifs. Afin de répondre à ce besoin d’optimisation, ce mémoire a pour objectif de combiner les méthodes usuelles de GLM avec les méthodes plus avancées de Machine Learning dans l’optique de proposer une alternative permettant de construire un modèle avec un meilleur pouvoir de segmentation et de prédiction tout en y apportant des éléments d’interprétation et qui soient opérationnellement peu coûteux. Pour ce faire, la démarche utilisée consiste dans un premier temps à incorporer aux algorithmes de Machine Learning en particulier le Boosting, des hypothèses de loi pour en déduire des fonctions de perte similaires aux fonctions de déviance des modèles GLM. Le but est d'adapter ces méthodes à des problématiques actuarielles et ainsi capter des interactions complexes qui ne peuvent l'être directement dans la modélisation GLM classique. Les modèles ainsi construits seront par la suite évalués à l’aide d’une base test et d’un processus d’évaluation afin d’évaluer la qualité de segmentation et de prédiction de ceux-ci. Pour finir, l'objectif sera d'utiliser différents outils d’interprétabilité (PDP, ICE, Feature Interaction, Feature Importance) pour rendre ces modèles transparents afin d'évaluer l'apport de cette approche.

Abstract
In France, the health insurance market is a very competitive market with reforms that increasingly protect policyholders. This forces insurers to optimise their pricing models in order to be more competitive. In order to meet this need for optimisation, this thesis aims to combine the usual GLM methods with more advanced Machine Learning methods in order to propose an alternative to build a model with better segmentation and prediction power while bringing elements of interpretation and which are operationally not expensive. To do this, the approach used consists firstly of incorporating into the Machine Learning algorithms, in particular Boosting, law hypotheses in order to deduce loss functions similar to the deviance functions of GLM models. The aim is to adapt these methods to actuarial problems and thus capture complex interactions that cannot be directly captured in classical GLM modelling. The models thus constructed will then be evaluated using a test base and an evaluation process in order to assess their segmentation and prediction quality. Finally, the objective will be to use different interpretability tools (PDP, ICE, Feature Interaction, Feature Importance) to make these models transparent in order to evaluate the contribution of this approach.

Mémoire complet