Mémoire d'actuariat

Réalisation d'un véhiculier à l'aide d'outils de Machine Learning
Auteur(s) CHAMOULAUD François-Xavier
Société Addactis France
Année 2020
Confidentiel jusqu'au 28/01/2022

Résumé
L'assurance automobile est un marché tendu et concurrentiel, l'assureur doit donc élaborer des modèles de tarification plus précis et à la pointe de la technologie pour approcher correctement le risque et rester dans la course au tarif. Les variables relatives aux conducteurs et à la géographie du risque sont les plus utilisées par les assureurs. Ainsi, comme dans le cadre de l'élaboration d'un zonier géographique, l'assureur peut s'intéresser à l'analyse de ses résidus pour proposer une segmentation homogène du risque en fonction du véhicule, appelée véhiculier, afin de compenser les biais de structure du portefeuille. Le risque véhicule est difficile à approcher, car beaucoup de véhicules sont peu exposés. La classification proposée par la Sécurité et Réparation Automobile (SRA) permet de segmenter le risque, mais cette classification est-elle optimale pour notre portefeuille automobile issu d'un assureur partenaire ? Dans une première partie, nous avons réalisé un clustering des véhicules, en ignorant la sinistralité observée. Deux approches ont été développées, une première en réalisant une carte des véhicules, puis une seconde en utilisant la notion de distance entre véhicules. Dans une seconde partie, nous avons extrait le résidu d'un modèle GLM sans variable véhicule afin d'élaborer un véhiculier pour la garantie dommage, séparément pour la fréquence et le coût moyen. La technique du Krigeage est utilisée pour lisser le résidu grâce à une carte des véhicules. Le résidu lissé est ensuite modélisé à l'aide d'un Gradient Boosting Machine permettant de capter les variables explicatives du risque véhicule. Les nouveaux véhiculiers sont alors intégrés séparément dans une modélisation GLM afin d'évaluer leurs efficacités respectives et de conclue sur leurs éventuels apports.

Abstract
Car insurance is a complex and highly competitive market; thus insurers have to elaborate thinner pricing methodology and always be at the edge of innovation to remain a significant market participant. Driver-related and geographic factors used to be the top interest variables for insurers. Following what can be done for zoning variables, insurers could analyze residuals derived for car-related features to build a strong and homogeneous segmentation and reduce bias induces by portfolio structure. It is generally challenging to estimate vehicle risk given the number of vehicles with low exposure. The Sécurité et Réparation Automobile (SRA) provides a classification which enable the insurer to make a first segmentation, however is this classification optimal regarding an insurer portfolio? Firstly, we conducted an unsupervised vehicle clustering regardless of the claim frequency or severity. Two clustering approaches have been developed, one using a vehicle map and the other using vehicle distance measures. Secondly, we extracted the residuals from a GLM model to develop a vehicle classification for damage warranty, for both the frequency and the average cost. The Kriging methods was used to smooth residuals thanks to a vehicle map. Finally, a Gradient Boosting Machine was fitted for modeling smoothed residuals, which allowed us to determine explanatory variables for vehicle-linked risk. New vehicles classifications are tested separately in a GLM model in order to assess respectively their own performances and to conclude on their potential benefits.