Mémoire d'actuariat

Modélisation de transformation de devis par apprentissage automatique
Auteur(s) BERGERE Matthieu
Société AXA Insurance UK
Année 2017
Confidentiel jusqu'au 20/03/2018

Résumé
L’optimisation tarifaire est nécessaire pour maintenir la profitabilité d’un portefeuille d’assurance dans un environnement concurrentiel. Cela nécessite des modèles complexes qui deviennent désuets dès que la concurrence ajuste ses prix. En conséquence, la charge de travail requis pour maintenir ces modèles à jour ne peut être soutenable que pour un grand portefeuille d’assurance à la personne. Pour mettre en place une optimisation tarifaire sur un portefeuille plus petit, il est essentiel d’automatiser le plus possible les éléments de cette optimisation. Deux activités résistent aux efforts d’automatisation : la construction et la calibration des modèles de transformation de devis. Il est possible de déléguer ces tâches à un ordinateur avec un algorithme d’apprentissage automatique. Bien qu’il existe une large gamme d’algorithmes, seulement deux ont été testé pour ce prototype : Gradient Boosting et Random Forest. Ces deux algorithmes ont été choisis pour leur simplicité à implémenter en R et pour leur différence avec le modèle linéaire généralisé qui est la pratique courante actuelle. Ils permettent de tester l’hypothèse de linéarité dans les modèles de transformation de devis. Le pouvoir prédictif de chaque méthode a été comparé au modèle linéaire généralisé sur deux produits différents pour tirer des enseignements en matière d’implémentation et d’efficacité. Les deux modèles ont obtenu de meilleurs résultats que le modèle actuel avec un temps de production beaucoup plus court.

Abstract
Price optimisation is a key component to maintain a profitable portfolio in a competitive environment. This requires complex models which are only valid until the competition adjusts its prices again. As a result, the workload required to maintain these models in a fit state can only be supported by large portfolios in the mass market of personal insurance. To implement price optimisation on a smaller portfolio, it is important to automate as much of the process as possible. Two key areas that have resisted any significant automation are the model construction and calibration. It is possible to delegate these tasks to a computer by letting the machine learn from previous data. Although there is a wide range of machine learning algorithms, only two were tested for this proof of concept: Gradient Boosting Machine and Random Forest. These two algorithms were chosen for their simplicity of implementation (in R) and their marked difference with linear models which represent the current industry practice. This challenge of the linearity assumption is an additional benefit proposed by some machine learning algorithms. The performance of each method has been assessed against generalised linear models on two different products giving some insight on best practice for implementation and showing competitive performance for a much shorter development time.

Mémoire complet