Mémoires d'Actuariat

Optimisation d’une mission de tarification en Santé Collective à Hong Kong via des algorithmes de Machine Learning
Auteur(s) TANDONNET M.
Société AXA EB Partners
Année 2022
Confidentiel jusqu'au 05/07/2024

Résumé
Au sein de l’entité AXA Hong Kong, le modèle de tarification des contrats collectifs d’assurance santé n’a pas été revu depuis une quinzaine d’années. L’objectif de l’étude présentée dans ce mémoire est donc de proposer un prix au plus juste de la couverture de santé collective. Ce mémoire met l’accent, en premier lieu, sur la préparation des données afin d’entrainer des modèles de régression sur la base la plus propre possible, pour ainsi améliorer la performance de ces modèles. Une modélisation par Modèles Linéaires Généralisés est ainsi envisagée. Cette méthode a l’avantage d’être robuste, facile à interpréter et facile à expliquer. Ces modèles ont ensuite pu être ajustés à l’aide de coefficients, afin d’intégrer certaines données exclues de la modélisation. Ces modèles ajustés ont ensuite été implémentés dans une calculatrice dans un premier temps, et dans un outil digital de souscription dans un second temps. Au cours des travaux de ce mémoire, les Modèles Linéaires Généralisés ont, par ailleurs, été challengés par des modèles de Machine Learning. Les modèles de comparaison utilisés ont été les Forêts Aléatoires et le Gradient Boosting.

Abstract
In the Hong Kong AXA entity, the group health pricing model has not been updated for around fifteen years. The goal of the study submitted in this essay is to propose the most trustworthy price for this group health cover. This study puts the emphasis on the data preparation in order to train regression models on the cleanest data set possible. Then, because of the Generalized Linear Models robustness and easy understanding, Generalized Linear Models have been selected for the modelling. Then, those models have been adjusted with coefficients in order to integrate some data excluded for modelling. Thus, adjusted models have been implemented firstly in a pricer, and finally in an underwriting digital tool. During this study process, Generalized Linear Models have been challenged by Machine Learning models such as Random Forest and Gradient Boosting.