Mémoires d'Actuariat

Développement et mise en application d'un algorithme de tarification sur un modèle de coût/fréquence et confrontation avec le GLM
Auteur(s) SAVOYE S.
Société ADDACTIS France
Année 2021
Confidentiel jusqu'au 08/02/2023

Résumé
Les problématiques de tarification ont toujours été au coeur des travaux en actuariat. L’uniformisation des modes de vie et la mondialisation jouent un rôle clé dans la propagation des risques. Ceux-ci se complexifient et les modèles qui les représentent doivent naturellement faire de même. L'abondance des données collectées et les améliorations des performances technologiques permettent alors de suivre cette tendance de sophistication. Bien que les modèles linéaires généralisés, dit GLM (Generelised Linear Model), se sont depuis longtemps imposés comme la méthode standard, notamment parce que la modélisation en coût/fréquence incite à se focaliser sur l'espérance du risque, il n'en demeure pas moins qu'ils présentent des limites évidentes. Des outils d'apprentissage plus complexes peuvent les pallier mais leur manque d'interprétabilité demeure un frein à leur application dans le monde de l'assurance. On va donc présenter, à travers ce mémoire, un nouveau modèle plus complexe que le GLM mais qui reste interprétable. On proposera de suivre le cheminement de sa conception étape par étape. Les premières parties de ce mémoire porteront alors sur les fondements mathématiques sur lesquels se repose notre méthode. La création de l'algorithme permettant l'implémentation de nos travaux ne sera que légèrement abordée, elle se reposera sur une méthode de descente de gradient proximale. On s'attardera davantage sur l'application de notre modèle à des données concrètes afin de confronter nos performances à celles du GLM, que l'on espère surpasser. Les données utilisées seront issues de la base de garantie dégât des eaux en assurance MRH (Multi-Risque habitation) d'une grande compagnie d'assurance. Les résultats seront présentés dans le dernier chapitre.

Abstract
Pricing issues have always been at the heart of actuarial work. Standardization of lifestyles and globalization are playing a key role in the spread of risks. They are becoming more complex and the models that represent them must naturally do the same. The abundance of data collected and improvements in technological performance make it possible to follow this trend of sophistication. Although generalized linear models, known as GLM (Generelised Linear Model), have long since established themselves as the standard method, in particular because cost-frequency modelling encourages a focus on risk expectation, they nevertheless have obvious limitations. More complex learning tools can compensate for this, but their lack of interpretability remains an obstacle to their application in the insurance world. We will therefore present, through this paper, a new model that is more complex than the GLM but which remains interpretable. We will propose to follow the development of its conception step by step. The first parts of this paper will then focus on the mathematical foundations on which our method is based. The creation of the algorithm allowing the implementation of our work will be only slightly discussed but it relies on a proximal gradient descent method. We will focus more on the application of our model to concrete data in order to compare our performances with those of GLM, which we hope to surpass. The data used will be taken from one of the top insurance compagnie HRM (Multi-risk home insurance) water damage guarantee database. The results will be presented in the last chapter. \

Mémoire complet