Mémoire d'actuariat

Revue des provisions dossier/dossier avec des méthodes de machine learning
Auteur(s) GIBAUD Gaël
Société ACTUARIS
Année 2018
Confidentiel jusqu'au 14/06/2020

Résumé
La norme prudentielle Solvabilité II en vigueur depuis le 1er janvier 2016 modifie l\'approche avec laquelle les assureurs doivent mesurer et gérer leurs risques. La notions de solvabilité est définie au travers de l\'exigence réglementaire de fonds propres dit SCR (Solvency Capital Required). Celui-ci assure une survie économique de l\'entreprise sur l\'année à venir avec une probabilité de 99,5%. Solvabilité II définit aussi quatre fonctions clefs, dont celle qui va nous intéresser ici : la fonction actuarielle. Elle a notamment pour rôle d\'encadrer le calcul des provisions et d\'établir un rapport donnant un avis et formulant des recommandations sur l\'ensemble des points fixés par la réglementation (la souscription, la réassurance, la qualité des données ou encore les provisions). Le responsable de la fonction actuarielle doit entre autre s\'exprimer sur le calcul des provisions et la robustesse des modèles utilisés. Pour cela, il doit veiller à ce que le risque soit estimé de la manière la plus juste possible tout en tenant compte des incertitudes pour garantir des provisions adéquates. L\'un des enjeux majeurs d\'une compagnie d\'assurance est donc de pouvoir honorer ses engagements malgré l\'inversion du cycle de production et de faire face alors à l\'aléa en anticipant les risques et en les évaluant. L\'estimation et la prévision des sinistres et de leur coût sont ainsi d\'une importance cruciale. Ces sinistres, lorsqu\'ils surviennent, sont étudiés, dès leur ouverture et tout au long de leur durée de vie, par des gestionnaires de sinistres chargés notamment d\'évaluer le plus précisément le coût final de chacun des sinistres. Chacun étant amené à suivre les sinistres qui lui sont affectés pour l\'entreprise d\'assurance. Ces évaluations sont prises en compte sous forme de provisions, ici les provisions du gestionnaire de sinistres, aussi appelées provision pour sinistres à payer dossier/dossier (PSAPdossier/dossier). Les provisions formant généralement la partie la plus représentative des passifs du bilan comptable d\'une compagnie d\'assurance, la fiabilité de leur évaluation est donc indispensable pour permettre à l\'entreprise de tenir ses engagements. L\'idée ici est d\'expérimenter un nouvel outil avec l\'objectif ambitieux d\'apporter, au responsable de la fonction actuarielle, un éclairage sur le provisionnement dossier/dossier. Le but est également de voir dans quelles situations l\'outil créé sera performant ainsi que les situations dans lequel il ne le sera pas. Chaque entreprise possède un processus d\'évaluation de PSAP dossier/dossier qui lui est propre. Celui-ci peut aussi dépendre de l\'expérience du gestionnaire de sinistres et des experts (avocats, experts sinistres). Les méthodes mises en place ici auront pour but de s\'extraire de cette évaluation en ne se basant que sur le portefeuille de l\'entreprise. Les différentes méthodes mises en place ici sont issues du domaine de la Data Science et plus précisément du Machine Learning. Nous partirons de la méthode des arbres de décision en utilisant les arbres de classification et de régression (CART), nous construirons des forêts aléatoires (Random Forest) et finirons avec l\'implémentation du Gradient Boosting Machine (GBM). Nous mettrons aussi en avant les réseaux de neurones. Ces méthodes commencent à émerger en actuariat (notamment les arbres de décision et les forêts aléatoires) et sont principalement utilisées en tarification incendie, accident et risques divers (IARD) dans le but de créer des tarifs plus précis que ceux obtenus par les modèles linéaires généralisés (Generalized Linear Models, GLM). Nous allons tenter de déterminer ici si l\'utilisation de ces techniques pourraient avoir un intérêt probant en provisionnement IARD. Nous évaluerons les charges ultimes des sinistres clos afin de voir quelle marge de progression est possible dans l\'appréciation des provisions. Ensuite nous appliquerons nos modèles sur les sinistrse ouverts afin d\'anticiper la charge de chaque sinistre en cours et comparerons les résultats obtenus par nos algrorithmes aux PSAP dossier/dossier apposées à ces sinistres par le gestionnaire. Cette étude sera faite à deux étapes de la vie du sinistre : à son ouverture et à sa dernière évolution. L\'intérêt recherché étant d\'aider la fonction actuarielle à se faire sa propre opinion sur le provisionnement dossier/dossier pour qu\'elle puisse ensuite émettre des recommandations destinées à améliorer ou à parfaire la politique de provisionnement et les procédures internes d\'évaluation des dossiers sinistres.

Abstract
The Solvency II norm, applied as for the biginning of January 2016, changes the way in which insurers have to mesure and manage risks. The idea of solvency is defined through a risk based approach with the Solvency Capital Required (SCR). This capital allows for the economic survival of the company with a probability of 0.995 for the ongoing year. This norm also sets up four key functions such as the one we are specificaly interested in : the actuarial function. Its role is to regulate the calculation of the reserves and hand in a report containing an opinion and recommandations on all the different ponts set by the reglementation. The person responsible of the actuarial funcion has to express himself on the calculation reserves by also on the robustness of the models that are used. He must thus check that the risk is estimated as precisely as possible while taking in account incertainty to allow for correct reserves. Indeed, one of the major issues at stake for an insurance company is to be able meet its commitments despite the inversion of the production cycle and to face the risk while correctly evaluatiing it. Predicting and estimating claims and their cost is thus crucial. Once these claims are reported, they are studied throughout their entire lifespan by claim managers whose roles are to evaluate as precisely as possible the cost of each claim. Each one of them following the claims handed to him by the insurance company. These estimates are taken into account under reserves, the claim manager reserves, also called the claim by claim reserves for claims outstanding. As these reserves represent the largest part of the liability balance sheet of an insurance company, the reliability of their estimates is of the upmost importance to allow for the company to uphodld its commitments. The idea here is to create a new tool with the ambitious goal of bringing to the actuarial function manager an insight on the claim by claim reserving. We also want to be able to evaluate when the tool will give us good or bad performances. Indeed, each company had its own reserving and evaluation process for the claim by claim approach. It can depend on the experience of the claim manager or the different experts involved. The methods we will be setting up will not involve these process\' as they will only be based on the company\'s portfolio. The different algorithms that we are going to use come from the Machine Learning part of Data Science. We will first of be implementing decision trees CART, then build Random Forest and set up Gradient Boosting Machine. We will also be using artificial neural networks. These methods are starting to be used in actuarial science. They are especially used in P&C pricing in order to obtain more precise premiums than the ones givent by the Generalized Linear Models, GLM. We will try to see if the use of these methods could be intersting in P&C reserving. We will be evaluating the final cost of closed claims in order to see what progression margin is possible when calculating reserves. Then, the models will be used on the open claims (the ones that are not yet settled) in order to anticipate their final cost and compare the results with the ones given by the claim manager. This study will be made when the claim is reported but also at its last financial mouvement. Our motivation is to help the actuarial function to make its mind up regarding the claim by claim reserves so that it can then give recommandations in order to improve the reserving policies and the internal procedures.