Mémoires d'Actuariat

Méthodes d’apprentissage statistique pour la segmentation des sinistres et l’évaluation des provisions non-vie
Auteur(s) DELRIO D.
Société AXA France
Année 2021
Confidentiel jusqu'au 08/07/2023

Résumé
Dans le cadre du provisionnement non-vie, la segmentation des sinistres automobile repose en général sur un regroupement selon plusieurs garanties (Incendie, Vol, Bris de Glace, . . . ) mais également selon le type de sinistralité (attritionnels, graves et climatiques). Cette segmentation en vigueur dans le contexte réglementaire actuel a pour but d’homogénéiser les classes de sinistres afin d’augmenter la précision des méthodes de provisionnement principalement basées sur des méthodes agrégées, telles que la méthode Chain-Ladder. Cette méthode reposant sur une hypothèse forte de stabilité de facteurs de développement individuels, il est important de regrouper les sinistres selon des critères de durée ou de coût par exemple. Ce mémoire aura ainsi pour but de proposer une solution de segmentation alternative basé sur des méthodes de Clustering en vue d’identifier des groupes de sinistralité pour effectuer des estimations de provisions par classe de sinistres. Les méthodes de Clustering, constitueront une approche non supervisée en vue de créer des classes de sinistralité homogènes. La minimisation de la variance intra-groupes ainsi que la maximisation de variance inter-groupes pourront ainsi permettre de minimiser les erreurs d’estimation finales lorsqu’elles seront effectuées par une méthode de provisionnement agrégée. Une approche supervisée sera ensuite utilisée afin de classifier chaque sinistre selon ses caractéristiques dans une de ces nouvelles classes de sinistralité. Cette seconde approche utilisera des modèles de substitution, principalement des algorithmes de classification basés sur des arbres de décision puis sur des méthodes d’apprentissage statistique plus complexes telles que les forets aléatoires ou l’utilisation du gradient boosting machine.

Abstract
In property and casualty claims reserving context, motor insurance claims are usually grouped by type of claim (Third Party Liability, or motor damage insurance) and size of the incurred loss. This is made according to the main lines of business (Fire, Theft, Windscreen, . . .) but also regarding the type of claim (Attritional, Large or Climatic). Claim reserving is usually performed using techniques like Chain-Ladder based on the sum of many claims. The group claim homogeneity then determines the reserve evaluation accuracy. This work investigates the use of clustering method in order to identify relevant groups of claims to improve the reserves estimation. Clustering methods will constitute an unsupervised approach in order to create homogeneous claim classes. The minimization of the intra-group variance as well as the maximization of the inter-group variance will thus allow to minimize the final estimation errors when they are carried out by an aggregate provisioning method. A supervised approach will then be used in order to classify each claim according to its characteristics within one of these claims’ classes priorly created by the clustering algorithms. This second approach will be based on surrogate models, mainly classification algorithms like decision trees and then on more complex machine learning methods such as random forest and gradient boosting machine. The models will be first validated according to a tradeoff between the amounts retained by Chain-Ladder projection on claims according to the current segmentation and that resulting from Machine Learning models.

Mémoire complet