Mémoire d'actuariat

Développement d’un zonier innovant en assurance moto : machine learning et données publiques à l'appui
Auteur(s) ETIENNE P-A.
Société Pericles Actuarial
Année 2020
Confidentiel jusqu'au 13/10/2022

Résumé
L’assurance moto étant devenue concurrentielle, il est important pour un assureur d’avoir la segmentation tarifaire la plus fine possible. Afin de prendre en compte le risque géographique dans la tarification, nous construisons un zonier qui correspond à une segmentation des zones par risque homogène. Ce mémoire se présente en quatre parties principales. La première consiste en une analyse de l’existant. Nous observons le portefeuille de l’assureur ainsi que le zonier qu’il utilise actuellement. Ensuite, nous analysons les différentes variables dans le portefeuille et faisons des regroupements de modalités à l’aide d’arbres et d’avis d’expert. Enfin, nous élaborons un modèle tarifaire théorique afin d’obtenir un indicateur de risque pour chaque zone représentée dans le portefeuille. Ce modèle tarifaire théorique est fait en fréquence et en coût à l’aide de modèle linéaire généralisé. Après avoir construit notre indicateur de risque sur la base des données du courtier, nous recueillons des données publiques à la maille la plus fine possible. Nous enrichissons la modélisation du risque du courtier à l’aide de machine learning exploitant notamment des données publiques. Cette démarche nous permet d’étendre nos informations de risque géographique sur l’ensemble du territoire. Enfin, nous construisons un premier zonier sur la fréquence des sinistres, un autre sur le coût des sinistres puis enfin, un troisième en combinant la fréquence et le coût. Subséquemment, nous comparons chacun des zoniers construits entre eux ainsi qu’avec celui utilisé actuellement par le courtier et sélectionnons le plus pertinent.

Abstract
With motorcycle insurance becoming competitive, it is important for an insurer to have the most precise possible price segmentation. It is from this observation that the classification of geographical risk seems relatively important. Indeed, it makes it possible to highlight the difference of risk suffered by the insured according to the zone where he circulates. In order to take geographic risk into account in pricing, we build a zoning to create homogeneous risk groups. This thesis is presented in four main parts. The first is an analysis of the existing. We observe the insurer's portfolio as well as the zone it currently uses. Then we analyze the different variables in the portfolio and make groupings of observations using trees and expert opinion. Next, we develop a theoretical pricing model to obtain a geographic risk indicator for each area represented in the portfolio. This theoretical tariff model is done in terms of frequency and cost using a generalized linear model. After building our risk indicator based on the insurer's data, we collect demographic, road, meteorological and other public data. to the finest granularity possible. We enrich the insurer's data by incorporating public data using machine learning models. This approach allows us to expand our geographical risk information across the entire territory. Finally, we build a zoning on the frequency of claims, one on the cost of claims and finally, one by combining the frequency and cost. Subsequently, we compare each of the zoning built between them as well as with the one currently used by the insurer and select the most relevant one.