Mémoires d'Actuariat

Conception d’un tarificateur prévoyance destiné au marché des TNS : Approche GLM et apprentissage supervisé
Auteur(s) GERBOUIN R.
Société ACTELIOR
Année 2022
Confidentiel jusqu'au 05/07/2024

Résumé
La population des travailleurs non salariés est une population spécifique. Elle se compose de profils disparates rendant sa tarification particulière par rapport à celle d’une autre population. Les non-salariés présentent un niveau de couverture en prévoyance inférieur à celui des salariés. Une prévoyance individuelle est alors nécessaire afin d’obtenir une couverture optimale. Le choix de la tarification s’est porté sur la décomposition de la charge ultime des sinistres en fréquence et en coût moyen d’un sinistre. Le modèle de coût moyen a nécessité d’être adapté au risque arrêt de travail. Le modèle développé s’avère finalement être un modèle de durée moyenne en arrêt à laquelle est multiplié le montant des indemnités journalières. Pour effectuer cette tarification, différents algorithmes ont été implémentés. Tout d’abord, la méthode traditionnelle du modèle linéaire généralisé a été développée. Cette méthode se révèle relativement simple à implémenter ainsi qu’à interpréter. Les algorithmes d’apprentissage supervisé, méthodes non paramétriques, ont ensuite été présentés puis appliqués. Tout d’abord, l’arbre CART a été implémenté. Il s’agit de l’algorithme qui a fourni les moins bonnes métriques d’erreur. Des méthodes ensemblistes ont ensuite été présentées, elles reposent sur la combinaison de plusieurs arbres CART que ce soit par agrégation pour la forêt aléatoire ou de manière adaptative pour le gradient boosting. Finalement, le meilleur modèle au sens des métriques d’erreur est celui obtenu par gradient boosting. Cet algorithme a donc été sélectionné pour construire les bases techniques de l’outil de tarification.

Abstract
The self-employed persons are a specific population. This population is composed of disparate profils which make the pricing particular compared to the one considering another population. Self-employed persons have a lower level of pension cover than employees. An individual social protection is then necessary in order to obtain an optimal coverage. The choice of pricing focused on the decomposition of the total cost of claims into the frequency and the average cost of a claim. The average cost model needed to be adapted to the risk of work stoppage. The developed model ultimately turns out to be a model of average duration in work stoppage at which is multiplied the amount of daily allowances. To perform this pricing, different algorithms have been implemented. First of all, the traditional method of generalised linear model was developped. This method turns out to be relatively simple to compute as well as to interpret. Machine learning algorithms, non-parametric methods, were then presented and computed. First, the CART algorithm was implemented. This is the algorithm that provided the worst error metrics. Set methods were then presented, they are based on the combinaison of several decision trees either by agregation for the random forest or adaptatively for the gradient boosting. Eventually, the best model in the sense of the error metrics is the one computed by gradient boosting. Therefore, this algorithm was selected to build the technical bases of the pricing tool.