Mémoire d'actuariat

Machine learning algorithms (regression trees and random forests) to monitor the performance of claim partners
Auteur(s) BARBRY Jean-Charles
Société Generali
Année 2016
Confidentiel jusqu'au 03/06/2018

Résumé
La direction indemnisation d'une compagnie d'assurance pilote la performance des réseaux de partenaires intervenant sur les sinistres, tels que les réparateurs automobiles agréés et non agréés, sur la base du coût moyen des sinistres et de la satisfaction moyenne des clients. Ces indicateurs dépendent particulièrement d'un ensemble de variables (ex. type de véhicule). Certaines d’entre-elles, indépendantes du partenaires (ex. type de sinistre) deviennent des biais de comparaison si leur distribution n’est pas identique pour tous les réseaux. Cette étude vise à développer des méthodologies permettant de mesurer la différence de performance non biaisée entre les réseaux de partenaires. L'objectif est d'évaluer la performance sur un même mix de sinistres pour les différents réseaux. Cette étude se focalise sur la comparaison entre les réseaux de garages agréés (PBS), et non agréés (NPBS). Deux méthodes sont présentées. La méthode de ‘Prédiction’, utilise des algorithmes d'arbres de régression et de forêts aléatoires, pour prédire le coût moyen des sinistres PBS, et applique ces prédictions sur un échantillon de sinistres NPBS. La méthode, appelée ‘Standardisation du Mix’, identifie le mix sinistre PBS en utilisant un arbre de régression, et évalue le coût moyen NPBS sur ce mix. Pour la satisfaction client, une ‘Standardisation du Mix’ a été appliquée. En synthèse, l'orientation vers les réparateurs agréés peut être renforcée de façon à bénéficier pleinement de l'écart de coût non biaisé identifié. Cette étude présente ensuite deux applications : le financement du service de ‘pickup and delivery’ via l’augmentation de l’orientation vers les agréés, et l’identification de sinistres en anomalie, dont le coût réel est en dehors de l’intervalle de confiance à 95% du coût prédit.

Abstract
The claim department of an insurance company monitors the performance of all partner networks involved in the claim resolution, such as preferred and non-preferred motor bodyshop networks, using the average cost of claims and the average client satisfaction. These indicators highly depend on a set of variables (e.g. the type of vehicle). Some of these variables, which are independent from the partner (e.g. the type of claims) become comparison biases if their distribution is not the same for all partner networks. The objective of this study is to develop methodologies to evaluate the unbiased performance gap between partners' networks. The aim is then to evaluate the performance on the same claim mix for all networks. This study focuses on the comparison between motor preferred bodyshops (PBS) and non-preferred bodyshops (NPBS) networks. Two different methods are presented. First, the ‘Prediction’ method, uses regression trees and random forests algorithms to predict the average cost of claims handled by PBS, and applies these predictions to NPBS sample. The second method, called the `Mix Standardization', identifies the claim mix of NPBS using regression trees, and evaluates PBS average cost on this mix. For Customer Satisfaction, a simple `Mix Standardization' method has been applied. In conclusion, canalization towards PBS can be promoted in order to fully benefit from the unbiased cost advantage that has been identified. This study then presents two applications: financing the pickup and delivery service through an increase of canalization towards PBS, and identifying outlier claims defined as claims with a real cost outside of the 95% confidence interval of the cost prediction.

Mémoire complet