Mémoires d'Actuariat

Modélisation d'un zonier en santé
Auteur(s) GENERALI
Société SOW C. A.
Année 2022
Confidentiel jusqu'au 20/06/2024

Résumé
Ce mémoire fait l’objet de la modélisation d’un zonier technique en santé destiné à des fins interne de pilotage de sophistication tarifaire. Une modélisation à la fois stable et précise nécessite un travail préalable de collecte et traitement des données brutes. Le développement des technologies de parallélisation des calculs combiné à la puissance des serveurs mis à disposition nous a permis de stocker un volume important des données et accélérer les temps de calcul, ainsi cela a permis d’établir un processus automatisé reproductible permettant de répondre aux besoins d’analyse et de compréhension du comportement des bénéficiaires portefeuille santé de Generali. Notre étude s’intéresse à la construction d’un nouveau zonier, le point de départ est la modélisation de la fréquence des sinistres par postes de garanties que nous avons effectué en utilisant les modèles linéaires généralisés sans prendre en compte l’information géographique. A l’issue de cette modélisation, les résidus obtenus ne sont pas simplement des bruits blancs, ils contiennent des informations liées au risque géographique. L’étape suivant du processus est lissé ces résidus par la méthode Krigeage pour réduire la forte variabilité entre les départements voisins. L’étude se poursuit sur la modélisation des résidus lissés à l’aide des méthodes de machine learning par des variables externes géographiques. La classification des résidus obtenus par krigeage nous permet d’obtenir le nouveau zonier. Le zonier étant construit, nous l’avons comparé au zonier du partenaire ce qui nous a permis de tirer les conclusions suivantes : nous avons une meilleure répartition du facteur risque géographique, le distributeur cible majoritairement les seniors du régime général, néanmoins, nous notons que notre partenaire dispose d'un portefeuille globalement rentable.

Abstract
This thesis deals with the modelling of a technical zoner in health intended for internal purposes of steering tarif sophistication. Stable and accurate modelling requires the collection and processing of raw data. The development of parallelization technologies combined with the power of the servers made available to us allowed us to store a large volume of data and to accelerate the calculation times, thus enabling us to establish a reproducible automated process that would meet the needs of analysis and understanding of the behaviour of Generali's health portfolio beneficiaries. Our study focuses on the construction of a new zoner, the starting point is the modelling of the frequency of claims by coverage item which we have carried out using generalized linear models without taking into account geographical information. At the end of this modelling, the residuals obtained are not simply white noise, but contain information related to geographical risk. The next step in the process is to smooth these residuals by the Kriging method to reduce the high variability between neighbouring departments. The study continues with the modelling of the residuals smoothed using machine learning methods by geographical external variables. The classification of the residuals obtained by kriging allows us to obtain the new zoner. The zoner being built, we compared it to the partner's zoner which allowed us to draw the following conclusions : we have a better distribution of the geographical risk factor, the distributor targets mainly the seniors of the general regime, nevertheless, we note that our partner has a globally profitable portfolio.