Mémoire d'actuariat

Etude de rentabilité des agents généraux sur la branche Multirisques Commerce : Modélisation du ratio de sinistralité
Auteur(s) HOUNDEKON A.
Société GENERALI
Année 2019

Résumé
L'avènement du big data a mis au service des organisations humaines (institutions, communautés, entreprises) un volume important de données de diverses sources qui ne cesse d'augmenter. Les entreprises se servent de plus en plus de ces données et des nouvelles techniques innovantes d'analyse de données pour évaluer, comprendre et améliorer leur rentabilité. Le monde de l'assurance n'est pas resté en marge de cette évolution. Les compagnies d'assurance utilisent la force des techniques du big data pour améliorer leur rentabilité, le ciblage des besoins des assurés rentables et aussi la rentabilité de leur réseau de distribution. Cependant les nouvelles méthodes de plus en plus innovantes utilisées par ces dernières sont difficilement compréhensibles. La compréhension et la modélisation de la rentabilité du réseau agent des compagnies d'assurance restent difficiles faute de connaissance d'un certain nombre de paramètres. Des paramètres surtout qualitatifs et difficilement mesurables comme le mode de gestion d'une agence ou d'un contrat par un agent. Ce mémoire étudie la rentabilité d'un réseau agent. Il se sert de données externes et de données portant sur l'activité de l'agent en multirisques commerce pour modéliser et apporter des explications sur la rentabilité des agents. La modélisation se base sur des méthodes de machine learning, de régression linéaire robuste et de nouvelles méthodes d'interprétation de modèles difficilement compréhensibles. Mots-clés : Machine learning, Gradient boosting, Forêt aléatoire, LIME, Lasso, Multirisque commerce, Rentabilité, Classification, Agence.

Abstract
With the advent of big data, a significant volume of data from various sources was introduced at the service of human organizations (institutions, communities, companies). Businesses are increasingly using this data with new innovative data analysis techniques to assess, understand and improve their profitability. The insurance world has not remained on the sidelines of this evolution. Insurance companies employ the strength of big data techniques to improve their profitability, profitable insureds’ needs targeting and also the profitability of their distribution network. However, these new innovative methods are difficult to understand. The understanding and the modeling of the insurance companies’ agent networks’ profitability remain difficult due to a lack of knowledge of a certain number of parameters, especially qualitative. Such parameters are difficult to measure e.g the mode of management of an agency or a contract by an agent. This dissertation analyses the profitability of the agents network given different datasets (external data, data on the agent activity related to commercial multi-risk insurance). We aim to provide explanations of the agent profitability using complex prediction methods, robust linear regression and new interpretation methods for models that are difficult to understand. keywords : Machine learning, Gradient boosting, Random Forest, LIME, Lasso , Commercial multi-risk insurance, Profitability, Classification, Agency.

Mémoire complet