Mémoires d'Actuariat

Reverse Engineering dans la tarification automobile
Auteur(s) HAINNEVILLE M.
Société Reacfin
Année 2021

Résumé
Dans un contexte de compétitivité accrue au sein du marché de l’assurance non-vie, et avec l’évolution constante des capacités de calcul des ordinateurs, il devient de plus en plus nécessaire pour un assureur de connaître sa place sur le marché. Afin de répondre à cette problématique, il est important de bénéficier de suffisamment de données pour mener des analyses pertinentes. Pour cela ce mémoire se base sur le principe de reverse engineering, permettant de retrouver le modèle de tarification utilisé par un assureur, et propose une comparaison des performances de différents modèles, des plus classiques (GLM, GAM) aux plus raffinés (Random Forest, GBM, réseaux de neurones). Une fois ces modèles définis, il est plus simple d’obtenir de nouvelles données sur un segment d’intérêt, ou d’exploiter directement ces modèles de manière à pouvoir étudier la position stratégique d’un assureur. En complément de cette analyse comparative, ce mémoire ouvre également la voie vers des solutions pour pallier à différents problèmes rencontrés lors de l’implémentation de cette méthodologie de reverse engineering. On citera notamment les problèmes liés à la sélection des variables et à une multicollinéarité éventuelle, ou ceux découlant d’interactions entre les variables, qui sont souvent utilisées pour répliquer au mieux les phénomènes réels. Finalement, la problématique d’un changement de tarif aléatoire au sein d’un portefeuille sera également évoquée, puisque dans notre processus de reverse engineering, il s’agit d’un évènement que l’on peut rencontrer et qui peut altérer défavorablement le modèle s’il n’est pas pris en compte.

Abstract
In a context of increased competitiveness within the non-life insurance market, combined with the constant evolution of the capacities of computers, it becomes more and more necessary for an insurer to be aware of its position on the market. In order to overcome this problem, it is important to have enough data to conduct relevant analyzes. This thesis uses the principle of reverse engineering, allowing to find the pricing model used by an insurer, and compares the performances of different models, from the most classic (GLM, GAM) to the most refined (Random Forest, GBM, neural network). Once these models are defined, it is quite simple to obtain new data on a segment of interest, or to directly exploit these models; it enables thus to study the strategic position of an insurer. In addition to this comparative analysis, this thesis also offers solutions to stun various problems related to this reverse engineering methodology. These include the problems associated with variable selection and possible multicollinearity, or those arising from interactions between variables, which are often used to replicate real phenomena. Lastly, the problem of a random price change within a portfolio will also be mentionned, since in our reverse engineering process, this is an event that can be encountered and which can alter in an unfortunate way our models if not taken into account.

Mémoire complet