Mémoire d'actuariat

Mise en oeuvre de méthodes innovantes de tarification
Auteur(s) BOUCHTA Ghita
Société Actuaris
Année 2017
Confidentiel jusqu'au 26/01/2019

Résumé
L'industrie de l'assurance est en constante évolution. En France, le contexte juridique, réglementaire et économique crée une importante concurrence entre les différents acteurs du marché. La croissance modérée constatée depuis quelques années sur le marché IARD et en particulier automobile accentue encore davantage cette concurrence. La tarification représente donc un enjeu majeur de démarcation pour les acteurs de ce marché. Actuellement, la méthode utilisée par les actuaires est le modèle linéaire généralisé (GLM). Cette méthode paramétrique s'est beaucoup améliorée ces dernières années. Par exemple, l'analyse approfondie des caractéristiques des assurés et de leurs véhicules, l'identification des profils de risque et leur segmentation font partie des éléments qui sont indispensables à la tarification. Le but de ce mémoire est de rechercher des méthodes innovantes de tarification qui peuvent concurrencer la méthodes des GLM. Par ailleurs, le développement de la science des données ("data science" en anglais) et plus particulièrement de l'apprentissage statistique, a permis le développement de méthodes de régression qui ont pu influencer plusieurs domaines. L'objectif est donc de comparer la méthode des GLM à ces différentes méthodes non-paramétriques (CART, Bagging, Random Forest, Boosting). Pour cela, nous disposerons d'une base d'apprentissage pour construire les modèles et d'une base de test pour effectuer une prédiction. Les modèles seront ensuite comparés selon leur qualité de prédiction. L'étude se décomposera en quatre grandes parties. La première partie se concentrera sur le principe de la tarification et l'analyse de la base de données à disposition. Ensuite, une partie sera consacrée aux GLM. La troisième partie portera sur les méthodes non-paramétriques. Enfin, nous analyserons les résultats obtenus et comparerons les modèles construits.

Abstract
The insurance industry is constantly evolving. In France, the legal, regulatory and economic context creates an important competition between the different market agents. In particular, the car insurance is moderately and constantly growing. Which emphasises the competition even more. As a result, the ratemaking represents a major stake. Currently, the method used by actuaries is the generalised linear model (GLM). This parametric method has greatly been improved theses pas few years. For instance, the thorough analysis of the insured characteristics and his car, the identification of risk profiles and their segmentation are among the essential elements of ratemaking. The aim of dissertation is to research innovative methods of ratemakin, which can challenge the GLM method. Furthermore, the data science development and particularly the machine learning development has allowed an improvement of regression methods which have influenced many sectors. Thus, the goal is to compare the GLM method to these different non-parametric methods (CART, Bagging, Random Forest, Boosting). To do so, we will have at our disposal a learning base to build models and a test base to make predictions. The models will then be compared based on their predictor ability. The study is composed of four parts. The first one will present the ratemaking theory and the data base analysis. Then, the second part will focuse on GLM. The ain of the third part is to lay down the theory and the computation of the machine learning methods. Finally, we will analyse the results and compare the models we built.