Mémoires d'Actuariat

Modélisation de la prime pure de la garantie "Dépannage-Remorquage" en assurance automobile : apport du machine learning
Auteur(s) NZATI E. C.
Société Axa France
Année 2022
Confidentiel jusqu'au 10/11/2024

Résumé
Dans un environnement hyperconcurrentiel comme celui de l’assurance automobile, la tarification des produits se révèle être un enjeu majeur pour les compagnies d’assurance. En effet, si les modèles de tarification n’ont cessé d’évoluer au cours des dernières années, l’objectif derrière le déploiement de ces modèles reste clairement le même : proposer des tarifs compétitifs et adaptés aux profils de risque des clients. Même si pour de nombreux assureurs, les modèles linéaires généralisés restent les plus privilégiés pour la tarification du risque, de nouveaux modèles de machine learning sont en train de transformer le secteur assurantiel car ils présentent d’indéniables gains de performances par rapport aux méthodes classiques et permettent d’explorer de nouvelles possibilités (utilisation de données non structurées, traitement de gros volumes de données, etc.). Ainsi, dans le cadre de cette étude, nous avons procédé à la refonte du modèle de prime pure de la garantie « Dépannage-Remorquage » d’AXA France en utilisant trois approches différentes (GLM, XGBoost, réseaux de neurones artificiels), l’objectif étant de les comparer en termes de précision, de segmentation, d’interprétabilité et de possibilités de mise en production. Pour atteindre cet objectif, il a été question dans un premier temps, de décomposer la prime pure comme la somme de deux composantes : la prime pure associée aux accidents et celle associée aux pannes. Ensuite, nous avons caractérisé les sinistres « graves » grâce à une approche quantile et enfin, nous avons développé les différents modèles de prime pure en utilisant l’approche fréquence-coût. Des indicateurs appropriés nous ont permis de comparer les modèles obtenus. Mots clés : Assurance automobile, tarification, prime pure, modèle fréquence-coût, modèle linéaire généralisé, machine learning, gradient boosting, réseau de neurones artificiels, précision, segmentation, interprétabilité, sinistres graves.

Abstract
In a hyper-competitive environment such as motor insurance, product pricing is a major issue for insurance companies. Indeed, although pricing models have continued to evolve over the past few years, the objective behind the deployment of these models remains clearly the same: to offer competitive rates adapted to the risk profiles of customers. Even if for many insurers, generalized linear models remain the most favoured for risk pricing, new machine learning models are transforming the insurance sector as they offer undeniable performance gains compared to traditional methods and allow new possibilities to be explored (use of unstructured data, processing of large volumes of data, etc.). Thus, within the framework of this study, we redesigned the pure premium model of AXA France's "Breakdown service and towing" cover using three different approaches (GLM, XGBoost, artificial neural networks), the aim being to compare them in terms of accuracy, segmentation, interpretability and possibilities of going into production. To achieve this objective, we first decomposed the pure premium as the sum of two components: the pure premium associated with accidents and that associated with breakdowns. Then, we characterised the "serious" claims thanks to a quantile approach and finally, we developed the different pure premium models using the frequency-cost approach. Appropriate indicators allowed us to compare the models obtained. Keywords: Motor insurance, pricing, pure premium, frequency-cost model, generalized linear model, machine learning, gradient boosting, artificial neural network, accuracy, segmentation, interpretability, severe claims.