Mémoires d'Actuariat

Construction d’un véhiculier en assurance automobile à partir de méthodes de Machine Learning
Auteur(s) GNANSOUNO L.
Société Sia Partners
Année 2022

Résumé
La segmentation tarifaire est aujourd’hui au cœur des enjeux de tarification en assurance. Secteur hyperconcurrentiel et en constante évolution, l’assurance IARD pousse ses acteurs à se démarquer sur tous les aspects du métier. Du côté de la tarification, les assureurs, afin de rester compétitifs, proposent des tarifs de plus en plus précis en différenciant leurs assurés par groupes de risques homogènes. Différents outils de mesures du risque existent et permettent à l’assureur d’individualiser au maximum le tarif. Par exemple, les zoniers utilisés en assurance multirisques habitation ainsi qu’en assurance automobile et les véhiculiers utilisés spécialement en assurance automobile. Le véhiculier est une variable tarifaire regroupant de façon homogène, les caractéristiques de véhicules ayant les mêmes profils pour un risque donné. Plusieurs approches ont été développées au cours des dernières années pour construire des véhiculiers. Ce mémoire propose une approche utilisant les méthodes de Machine Learning (ML), sur un portefeuille d’assurance couvrant la Responsabilité Civile Matérielle. Cette approche est basée sur la modélisation des résidus d’un modèle de tarification GLM, calibré sans les variables liées au véhicule. L’information non expliquée par le modèle GLM classique et contenue dans les résidus, sera modélisée grâce aux méthodes de Random Forest et de Gradient Boosting. Ces résidus modélisés seront par la suite clusterisés, afin de former des classes de véhicules, donc le véhiculier. Nous évaluerons l’apport et la pertinence de cette nouvelle variable à travers des analyses et des comparaisons de modèles. Mots clés : Assurance non-vie, tarification, segmentation, classification de véhicules, Random Forest, Gradient Boosting.

Abstract
Pricing segmentation is at the heart of insurance pricing issues today. As a hyper-competitive and constantly evolving sector, property and casualty insurance pushes its players to stand out in all aspects of the business. In order to remain competitive, insurers, are offering increasingly precise rates by differentiating their policyholders by group of homogeneous risks. Different risk measurement tools exist and allow the insurer to individualize the rate as much as possible. For example, zoning variables are used in home insurance and in motor insurance, and vehicles classification are used in motor insurance. The vehicle classification is a rating variable that groups together in a homogeneous way the characteristics of vehicles with the same profiles for a given risk. Several approaches have been developed over the last few years to construct these classifications. This paper proposes an approach using Machine Learning (ML) methods, on an insurance portfolio covering Third Party Damage (TPD). This approach is based on the modeling of the residuals of a GLM pricing model, calibrated without the vehicle variables. The information not explained by the classical GLM model and contained in the residuals will be modeled using Random Forest and Gradient Boosting methods. These modeled residuals will then be clustered in order to form the vehicle classes. We will evaluate the contribution and relevance of this new variable through analyses and model comparisons. Keywords: Non-life insurance, pricing, segmentation, vehicle scoring, vehicle classification, Random Forest, Gradient Boosting.

Mémoire complet