Mémoire d'actuariat

Tarification au trajet à l\'aide de l\'Open Data
Auteur(s) NICOLLE Claire
Société Sia Partners
Année 2017

Résumé
Dans le cadre de la tarification, les zoniers classiques résultent de données statiques liées à l'adresse de stationnement. Si pour certaines garanties comme le vol ou l'incendie ce choix semble pertinent, ces zoniers peuvent comporter quelques inconvénients pour la responsabilité civile. En effet, celle-ci est en règle générale mise en cause lors du déplacement du véhicule. Il ne semble donc pas judicieux de s'intéresser à la seule donnée de stationnement du véhicule. L'objectif de ce mémoire est d'intégrer à la tarification un trajet quotidien connu de l'assureur : le trajet domicile - travail. Les assureurs possèdent en règle générale toute l'information nécessaire à l'estimation d'un itinéraire, c'est-à-dire le lieu de stationnement du véhicule, le lieu de travail de l'assuré ainsi que les conditions d'utilisation du véhicule. La finalité de ce mémoire étant de déterminer l'apport de données géographiques agrégées au niveau trajet en lieu et place de données statiques, deux zoniers sont créés en utilisant la même méthode : l'application d'un algorithme de forêt d'arbres aléatoires, aussi appelée Random Forest, sur les résidus d'un modèle tarifaire GLM hors données géographiques. Ce modèle utilise des données géographiques externes, agrégées par trajet ou commune. L'utilisation d'une API Google permet de connaître l'itinéraire entre deux communes, de ce fait chaque assuré se voit associer un certain nombre d'indicateurs en fonction des communes parcourues sur son trajet domicile-travail. Ces indicateurs sont des informations disponibles à l'échelle communale sur l'Open Data, ils peuvent être démographiques ou relatifs aux accidents de la circulation et au réseau routier.

Abstract
Today the standard zonier results from static data linked to the parking address. For some guarantee types such as guarantees against theft or fire, this kind of zonier seems appropriate whereas for other guarantees such as civil liability of use of zonier can be called into question. Indeed, civil liability is generally used in the case of a journey, so it does not seem relevant to use only the data linked to the parking of the vehicle. The aim of this report is to use the daily commute between home and work of insured individuals, known by insurers, to improve the risk analysis. Insurers generally possess all the information needed to estimate an itinerary, namely the parking location, the location of the workplace of the insured individual and the use of the vehicle. The purpose of this report is to find out the contribution of aggregated geographical data to the journey instead of static data. Two zonier are created using the same method : the application of a Random Forest on the residuals of a GLM, made on pricing variables without taking into account geographical ones. This Random Forest uses the indicators available in the Open Data and aggregates by journey or by municipalities depending on the zonier type. To know the itinerary between two municipalities, Google API is used, hence to every insured individual is associated plenty of indicators in function of the municipalities crossed during the journey between their home and their work. This indicators are information available at the communal scale in the Open Data, they can be of various categories : demographic, related to the road accidents or the road network.

Mémoire complet