Mémoire d'actuariat

Estimation de la probabilité de maintien d\'activité de courtiers, à l\'aide de méthodes d\'apprentissage automatique
Auteur(s) LESAGE Laurent
Société April Santé Prévoyance
Année 2017
Confidentiel jusqu'au 06/03/2019

Résumé
Avec des milliers de courtiers dans son réseau, l'animation commerciale d'April se doit d'être optimisée. Elle doit notamment être ajustée aux courtiers les plus susceptibles d'arrêter leur collaboration avec April, afin de conserver un maximum d'apporteur. Cela implique de savoir détecter quels sont ces courtiers ayant des raisons de vouloir stopper toute activité avec April (concurrence, mauvaises relations avec April...). Ce mémoire propose des modèles statistiques permettant d'évaluer, pour chaque courtier travaillant avec April, une probabilité de maintien d'activité avec l'entreprise. Ainsi, les commerciaux d'April pourront orienter leur travail de manière à satisfaire ceux ayant les probabilités de maintien les plus faibles. L'approche machine learning a été choisie, car nous recherchons une bonne qualité de prédiction tout en ayant peu d'a priori sur la loi suivie par cette probabilité, la pertinence des variables explicatives incorporées dans le modèle, ou encore les interactions entre ces variables. La première partie de ce mémoire propose une première analyse descriptive des courtiers collaborant avec April, de manière à s'approprier les variables explicatives de notre modèle. La seconde partie décrit l'ensemble des algorithmes d'apprentissage automatique qui seront utilisés : leurs intuitions, les éléments mathématiques nécessaires à leur description, et leur paramétrage de manière à optimiser leur usage. La troisième partir retranscrit la modélisation de la probabilité de maintien, à l'aide de ces algorithmes.

Abstract
April must optimize its sales events, because of thousands of brokers in its network. In particular, these sales events must be suitable for brokers who are most likely to stop their collaboration with April, in order to keep as many providers as possible. This implies to be able to spot brokers who are about to stop any activity with April, because of competition, bad relationships with April, etc. This essay suggest statistical models which allow to estimate likelihood for brokers to keep providing affairs to April. Thus, April's sales department could adapt their work to satisfy brokers who have the lowest likelihoods. We have chosen a machine learning approach, because we want to have predictions of good quality, with few starting hypothesis about density function, variables'importance, interactions between variables, etc. The first part suggest a descriptive analysis of brokers used to work with April, in order to have better knowledge about variables. The second part aims to describe all the machine learning algorithms : their philosophy, some mathematical elements, and their configuration in order to optimize their efficiency. The third part describes likelihood modelling, thanks to theses alogrithms.