Mémoires d'Actuariat

Création d’une variable tarifaire d’interactions en assurance automobile par machine learning
Auteur(s) BACHELET C.
Société Generali France
Année 2021
Confidentiel jusqu'au 08/07/2022

Résumé
Dans un contexte de prix toujours plus compétitifs, les assureurs automobiles se doivent de construire des tarifs de plus en plus attractifs pour attirer de nouveaux clients. Pour cela, il est nécessaire de rechercher plus de performances dans les modèles de sinistres des garanties proposées. Cela se fait notamment par la sophistication de ces modèles en y intégrant des méthodes innovantes. Dans cette optique, ce mémoire utilise certains algorithmes de machine learning pour diminuer à plusieurs niveaux les erreurs des modèles tarifaires automobiles, tout en conservant le caractère interprétable des modèles linéaires généralisés, structure classique de tarification. Pour cela, nous partons des modèles actuels en fréquence et coût moyen, dont nous complétons l’information externe pour perfectionner le zonier. Des machine learning sont ensuite appliqués pour stabiliser les résidus du modèle, avant de leur appliquer un arbre choisi par bootstrap. Les branches de cet arbre constituent les modalités de la variable d’interaction cible. Nous évaluons finalement dans quelle mesure cette nouvelle variable fait gagner en performance lorsqu’elle est ajoutée aux modèles. Cette démarche est testée sur les garanties bris de glace et dommages tous accidents, qui ont chacune des spécificités de modélisation. Elle donne des résultats très mitigés sur ces deux garanties, en bris de glace où elle n’améliore que très peu la fréquence, tandis que le gain sur la dommage tous accidents est également faible et situé uniquement au niveau du coût moyen.

Abstract
As prices in the car insurance industry are getting more and more competitive, car insurers must propose increasingly attractive rates to attract new customers. As such, it is necessary to seek higher performances in proposed guarantees for loss models. Those designs can be sophisticated by incorporating innovative methods. Keeping that in mind, this thesis uses machine learning as a way to reduce errors in the car insurance’s pricing models at several levels, while retaining the interpretable character of generalized linear models, as a classic pricing structure. For this, we start from the current models for frequency and average cost of claims, to which we supplement the external information to perfect the rating by geographic areas. Machine learning is then applied to stabilize the residuals of the model, before applying to them a regression tree chosen by bootstrap. The branches of this tree constitute the modalities of the target interaction variable. Finally, we evaluate to what extent this new variable improves performance when added to the models. This approach is tested on breakage and all accident damage guarantees, which have specific modeling features. The results shows very minor improvements in models : in windscreen cover it only slightly improves frequency performance, while the gain on damage from all accidents is bearly visible on the average cost of claims.

Mémoire complet