Mémoires d'Actuariat

Provisionnement en assurance IARD à l'aide de la Data Science
Auteur(s) JULLIA L.
Société Crédit Agricole Assurances - Pacifica
Année 2022

Résumé
L’inversion du cycle de production inhérent à l’activité même d’une compagnie d’assurance engendre une incertitude quant aux montants qu’elle devra indemniser dans le futur afin de réparer les préjudices subis par ses assurés. Pour un assureur, le provisionnement est la pratique qui consiste à estimer le plus précisément possible les réserves à constituer afin qu’il soit en mesure de tenir ses engagements auprès de ses assurés. Plusieurs méthodes statistiques sont disponibles afin d’atteindre cet objectif. La technique du Chain-Ladder est la plus utilisée et est ancrée depuis des années au sein des compagnies d’assurances. Cette méthode à de nombreux avantages tels que sa facilité d’application ainsi que son interprétabilité intéressante. Cependant, de par la nature des données utilisées, cette approche ne permet pas d’utiliser toute l’information disponible pour chaque sinistre. L’utilisation de ces informations est un sujet de recherche actif au sein de la communauté actuarielle. C’est dans ce contexte qu’intervient la Data Science. Les modèles qui y sont associés sont de plus en plus utilisés dans tous types d’industries grâce à la collecte massive des données dans l’ère actuelle du Big Data. Son utilisation dans le cadre du provisionnement permettrait d’esquisser la possibilité d’une estimation à la maille individuelle, en utilisant les informations à disposition pour chaque sinistre. Au cours des travaux de ce mémoire, nous avons développé un modèle de Deep Learning capable de prendre en compte des dépendances temporelles à l’aide de neurones récurrents. L’objectif est de prédire les réserves à la maille individuelle avec précision, tout en essayant de répondre aux problématiques de durée d’exécution et d’interprétabilité inhérentes à leur nature.

Abstract
The inversion of the production cycle inherent in the very activity of an insurance company creates uncertainty as to the amounts it will have to compensate in the future in order to repair the damage suffered by its policyholders. For an insurer, provisioning is the practice of estimating as precisely as possible the reserves to be set up so that it is able to meet its commitments to its policyholders. Several statistical methods are available in order to achieve this objective. The Chain-Ladder technique is the most widely used and has been anchored for years in insurance companies. This method has many advantages such as its ease of application as well as its interesting interpretability. However, due to the nature of the data used, this approach does not make it possible to use all the information available for each claim. The use of this information is an active research topic within the actuarial community. This is where Data Science comes in. Models associated with it are more and more used in all types of industries thanks to the massive collection of data in the current era of Big Data. Its use in the context of reserving makes it possible to outline the opportunity of reserving at the individual grid level, using all the information available. During the work of this thesis, we have developed a Deep Learning model capable of taking into account temporal dependencies using recurrent neurons. The aim is to predict accurately the reserves at the individual grid level, while trying to answer the issues of execution time and interpretation inherent to their nature.

Mémoire complet