Mémoire d'actuariat

Apport des méthodes d'apprentissage statistique pour le provisionnement individuel en assurance non-vie
Auteur(s) FABRE RUDELLE Damien
Société KPMG
Année 2018

Résumé
Dans un nouveau contexte où l'information est plus que jamais omniprésente et disponible, les assureurs non-vie cherchent à développer de nouvelles méthodes de provisionnement utilisant des données jusqu'alors peu exploitées. Ces méthodes ont plusieurs objectifs : d'une part obtenir des provisions plus précises, et d'autre part mieux évaluer et connaître les risques. Les enjeux de la bonne prédiction de l'évolution du coût des sinistres sont partie intégrante de la maîtrise des risques, notamment pour les branches à duration longue comme la Responsabilité Civile Corporelle, et peuvent être aussi bien réglementaires, stratégiques que financiers. Dans ce mémoire, nous nous intéressons à l'élaboration d'un modèle de provisionnement individuel. Nous utiliserons une base de données réelles d'un assureur français, comportant des variables descriptives sur les sinistres : la gravité du sinistre, les caractéristiques des blessure ou bien encore le taux d'AIPP. Nous commencerons par un état de l'art sur les méthodes de provisionnement en assurance non-vie, aussi bien sur celles classiques agrégées que sur celles individuelles. Nous formaliserons par la suite notre problème de provisionnement et la modélisation utilisée. Nous utiliserons des méthodes classiques en assurance non-vie, comme les GLM pénalisés, ainsi que les méthodes d'apprentissage statistique : les forêts aléatoires et les réseaux de neurones. Nous comparerons les résultats obtenus par nos modèles aux données réelles et aux prédictions obtenues par une méthode de Chain-Ladder. La synthèse de ce mémoire viendra finalement décrire les apports et les limites de nos travaux, tout en proposant une ouverture sur de potentielles études futures.

Abstract
In times where data is ever more omnipresent and available, non-life insurers are searching for new reserving methods capable of utilizing data that is not commonly used. These methods have several purposes: estimate reverses more accurately and enhance their knowledge on the risks to which they are exposed. A precise evaluation of reserves is part of a good risk management process, especially for long duration segments such as the risk of corporal injury. Insurers try to find new reserving methods to tackles ever-changing challenges such as regulatory, strategic or financial conundrums. In this study, we will focus on the implementation of an individual reserving method. We aim at using the potential of individual data and we'll base our work on a dataset from a French insurer. It includes detailed claim-level data with many explanatory variables, such as whether the claim is considered large or not, information on the injuries and the disability rate. In the first part, we will begin by describing traditional reserving methods used in non-life insurance, and we will destinguish aggregate-level and individual-level methods. In the following part, we shall formalize our reserving methodology. We will begin by commonly used methods such as penalized GLM, and will also use machine learning methods capable of detecting non-linear interactions, such as random forests and neural networks. We will then compare the obtained results with real data and with predictions resulting from the use of a tradition reserving method, Chain-Ladder. Finally, this paper synthesis will describe the contribution of our study and propose improvements for future potential works.

Mémoire complet