Mémoire d'actuariat

Analyse des données pour la prise de décision opérationnelle : exemple de la dynamique de résiliation sur un contrat d\'assurance complémentaire santé individuelle
Auteur(s) DUTEL Arthur
Société Deloitte Conseil
Année 2017
Confidentiel jusqu'au 30/03/2019

Résumé
L'utilisation des données tient un rôle de plus en plus central dans l'industrie de l'assurance. Les mots "Big Data" et "Predictive Analytics" sont souvent utilisés, cependant la révolution peine à se faire sentir. D'une part la structure des données classiques des compagnies d'assurance ne s'apparente pas toujours au Big Data au sens où certains portails en ligne le traitent (Amazon change ses prix 2 500 000 fois par jour). D'autre part, l'amélioration constante de la modélisation et la prédiction en tirant partie de l'augmentation des puissances de calcul constitue une tendance de long terme. A court terme, la capacité à utiliser en production les enseignements tirés des données et mesurer les gains réalisés sont des préalables avant d'aller plus loin. Dans ce contexte, nous appliquons au portefeuille d'un jeune courtier en assurance santé complémentaire individuelle une démarche d'analyse pragmatique des comportements de résiliation. Notre objectif est de nous appuyer sur des techniques statistiques (cartes auto-adaptatives, k-means, random forest) afin de délivrer des recommandations sur le positionnement tarifaire applicables opérationnellement. Nous tentons par ailleurs de nous placer dans la démarche Lean startup décrite par Eric Ries afin de proposer, en plus de ces recommandations, des éléments à mettre en place pour implémenter une boucle construire - mesurer - apprendre sur le tarif.

Abstract
Data usage is becoming a central part of the insurance industry. But as much as words such as "Big Data" and "Predictive Analytics" are used more and more throughout the industry, it seems that the big shift has not taken place yet. There are two reasons for that. First, most of the data used by insurance companies does not qualify as "Big Data" if we thik of it in the context of major network orchestrators' operations (Amazon changes its pricing 2,500,000 times a day). Second, constant improvment of predictive modelling empowered by increased computing capacities is a long term tendency. On a shorter timespan, challenges seem to lie in the measurability of such improvements as well as the industrialisation of new predictive models and their integration in the production systems. In this thesis, we apply a pragmatic step by step analysis to the lapse bahaviour observed in an individual health insurance broker's portfolio. Bys using statistical technics (self-organizing maps, k-means, random forest), we ain at delivering simple operational conclusions that can be applied directly to the pricing. On top of that we try to leverage on the Lean Startup framework formulated by Eric Ries to commend a list of actions in order to implement a build - measure - learn loop on pricing.