Mémoire d'actuariat

Approche tarifaire des contrats collectifs Frais de Santé à l\'aide des méthodes d\'apprentissage
Auteur(s) KARAMOKO FOFANA Cheick Hassane
Société Malakoff Médéric
Année 2017
Confidentiel jusqu'au 05/09/2019

Résumé
Le marché de l'assurance Santé en France est de plus en plus soumis à des réglementations qui modifient l'activité de l'assureur. Ces évolutions réglementaires en faveur des assurés rendent le marché de l'assurance Santé très concurrentiel. Dans ce contexte, les assureurs doivent proposer des garanties adaptées à la sinistralité des individus et aux tarifs les plus fins. Pour anticiper le développement du Big Data et toujours dans la perspective d'une segmentation plus juste, l'objectif de ce mémoire est d'améliorer les processus tarifaires à l'aide des algorithmes du Machine Learning, notamment les arbres binaires de décision ou la forêt aléatoire. L'idée est de comparer ces nouvelles méthodes avec les méthodes actuelles de tarification en assurance collective en se basant sur un échantillon de clients grands comptes du portefeuille MALAKOFF MEDERIC. Ce mémoire se compose en quatre grandes parties. La première partie est consacrée au cadre réglementaire de la protection sociale et aux principes de tarification. Ensuite, nous avons présenté la théorie d'élaboration des différents modèles à savoir les Modèles Linéaires Généralisés et les deux algorithmes du Machine Learning et leur application sur notre base de données relatives à l'assurance Santé collective. Enfin, une analyse comparative des résultats a montré la capacité prédictive des algorithmes du Machine Learning, notamment la forêt aléatoire. Par souci de lisibilité des résultats de la forêt aléatoire, nous avons modélisé ces résultats à l'aide des arbres binaires de décision. Cette nouvelle prédiction s'est distinguée par sa facilité d'interprétation et des résultats plutôt similaires à ceux de la forêt aléatoire.

Abstract
Life insurance in France and especially is more and more submitted to many regulations which consequently modify the insurer's activity. These regulatory that benefit mostly to insured people make the heatlh insurance market very competitive as usual. In this context, the insurers must better adapt guarantees adapted to individuals with best prices. In order to anticipate the development of Big Data and to have always an accurate segmentation, this thesis aims to upgrade pricing processes using Machine Learning algorithms, in particular decision trees or Random Forest. Its goal is to compare these new tarification methods with the actual ones, based on a significant sample taken from the key accounts portfolio of MALAKOFF MEDERIC, one of the leader of employee benefits insurance in France… This thesis is divided into four main parts. First, we introduce the regulatory framework of social protection and pricing principles. Then, we present the the different models analysed namely the Generalized Linear Models and the two algorithms of Machine Learning and their application on our database. Finally, a comparative analysis of the results showed the predictive capacity of Machine Learning algorithms, in particular the Random Forest. To make clear, we have modeled the results of the Random Forest using binary decision trees. This new prediction mean interest is its easier interpretation with results quite similar than the Random Forest ones.