Mémoire d'actuariat

Modélisation de la survenance d\'un sinistre dans le cas d\'une asymétrie des classes et utilisation dans le cadre d\'un modèle interne partiel
Auteur(s) DJOFFON Ornellia
Société CEGC
Année 2017
Confidentiel jusqu'au 05/09/2019

Résumé
Pour modéliser un évènement dichotomique la méthode la plus courante est la régression logistique. Mais avec le développement des techniques d'apprentissage, les arbres de décisions sont de plus en plus utilisés. En assurance, lorsque les données de sinistralité présentent un déséquilibre des classes, les méthodes classiques de modélisation de la survenance ne sont pas toujours adéquates. Le déséquilibre des classes est une situation dans laquelle l'une des classes de la variable dichotomique est minoritaire. Dans ce cas de figure trouver un bon modèle pour modéliser cette variable n'est pas toujours aisé. Pour traiter le déséquilibre de classes observées sur les données de sinistralité, nous avons choisi de considérer ces deux approches. D'une part les techniques utilisées pour adapter le modèle de régression logistique à des données présentant un déséquilibre des classes d'autre part les méthodes utilisées en apprentissage. Pour chaque approche, le meilleur modèle en termes de performances d'ajustement et de prédiction est retenu pour modéliser la survenance du sinistre. L'étude de ces méthodes s'inscrit dans le cadre de la recherche d'un bon modèle de survenance de sinistre, ce qui s'avère primordial dans une démarche d'évaluation des risques de souscription par une approche modèle interne. En s'appuyant sur les modèles de survenance adaptés au problème d'asymétrie des classes, nous avons pu modéliser le risque de prime. Les autres risques de souscription sont également abordés au travers d'une approche modèle interne. Nous présentons le modèle interne partiel construit pour l'évaluation du capital de solvabilité requis pour les risques de souscription puis les résultats obtenus pour ce modèle sont comparés aux résultats en formule standard.

Abstract
To model a dichotomous event, the most common method is the logistic regression. With the development of learning techniques, decision trees are though increasingly used. In insurance, when claims data presents a class imbalance problem, the traditional methods used for modeling the occurence of claims are not always adequate. Class imabalance is a situation in which one of the classes of the dichotomous variable is a minority. In this case the total number of one class of the variable is far less than the total number of the other class. It's then complicated to find a good method to model this variable. To deal with the imbalance of classes observed on the claims data, we have chosen consider two approaches. On one hand we studied techniques used to adapt the logistic regression model to data presenting a class imbalance problem and on the other hand methods used in learning to deal with unbalanced data. For each approach, the model with the best predictive performance and adjustment quality is selected to model the occurence of claims. In the context of modeling underwriting risk through an internal model approach, the search for a good model for the occurence of claim is central. With the model selected to correct the class imbalance problem, we have implemented the calculation of the premium risk. The other underwriting risks are also modeled by an internal model approach. Ultimately, we are proposing a partial internal model for the valuation of the solvency capital required for underwriting risks. The results obtained for this partial internal model are then compared with the results obtained with standard formula.