Mémoire d'actuariat

Analyse et optimisatin d'un produit automobile dans un contexte économique concurrentiel
Auteur(s) MIETTON Lucas
Société Actuelia
Année 2020

Résumé
L'objectif de ce mémoire consiste à comprendre les difficultés auxquelles font face les compagnies d'assurance de petite et moyenne taille, au sein d'un environnement hautement concurrentiel qu'est le domaine de l'assurance automobile. Prenant comme cas pratique un groupe d'assurance, les travaux sont de ce fait axés autour de la problématique de la rentabilité pour le réassureur du contrat lié aux garanties automobiles. L'idée est qu'en optimisant le portefeuille et en identifiant les mauvais profils du portefeuille dans un premier temps, et dans un second temps en renvoyant la méthode de tarification, la rentabilité amélioré de l'assureur permettra de transmettre une part de résultat et de solutionner le problème. Il a d'abord été convenu de préparer les données pour leur utilisation dans le cadre d'analyses bivariées. En traitant les problèmes concernant la qualité des données, des premiers résultats sont obtenus, permettant notamment de préciser les profils mal tarifés. Ceux-ci ont permis de tirer les premières conclusions quant aux variables apparemment intéressantes à traiter par la suite lors de la mise en place de nouvelles méthodes de tarification pour le groupe. Une phase de retraitement des données a ensuite été effectuée. Des clustering suivant la méthode de Ward ont permis d'obtenir des informations sur des regroupements par la suite retraités au cas par cas. L'étude des corrélations préparatoire à l'application d'un Generalized Linear Model (GLM) a également été effectuée. Enfin, une des variables n'étant pas totalement complétée, des méthodes de Data Science telles que les Classifications And Regression Trees (CART) et les Random Forest ont été déployées afin de résoudre le problème. Les travaux de tarification ont par la suite été abordés dans l'optique d'utiliser un GLM. Après la visualisation des résidus fournis par les sorties du modèle pour le modèle de fréquence, il a été question de faire appel aux mêmes méthodes de Data Science pour que la complétion de la variable, afin d'obtenir un modèle de coût adapté. Dans ce contexte, un algorithme de Gradient Boosting Model (GBM) est utilisé pour modéliser les coûts de chaque garantie. Ces travaux ont mené à l'analyse des résultats après l'application du modèle de coût-fréquence obtenu. Faisant écho aux résultats discutables obtenus par l'analyse des résidus, le GLM semblait non-adapté pour la modélisation de la fréquence, en raison du peu de données mises à disposition. Une méthode de Random Forest est donc finalement appliquée afin d'obtenir une modélisation plus réaliste. Par la suite, les résultats sont intégrés au programme de réassurance, et les rentabilités du réassureur et de l'assureur sont discutées. Une méthode est mise en place afin de constater si une meilleure répartition de la prime totale entre les garanties est possible pour améliorer le résultat global pour le réassureur. Enfin, les résultats de la modélisation sont intégrés au Business Plan du groupe dans le cadre du pilier 2 de la Directive Solvabilité 2 afin d'en observer les impacts éventuels sur le résultat et le ratio de solvabilité de l'entreprise.

Abstract
This paper is aimed at understanding the issues the little to medium sized insurance companies are facing within the automobile insurance field, a highly concurrential market. Threrefore, as the practical case of an insurance gropu is taken, the work is focused around the reinsurer profitabiity problematic for the contract based on the automobile warranties. By optimizing the portfolio and by identifying its bad profiles in a first part, and by reconsidering the pricing method in a second part, the increased profitability for the insurer will allow a transfer of a part of the result, which will theoretically solve the issue. First, the data needed to be prepared to be used in bivariate analysis. By solving the issues about data quality, some results are obtained, notably allowing to precise the charateristics of t he badly priced profiles. These allowed a draw of the first conclusion concerning the interesting variables to be treated during the implementation of the new pricing method for the group. Then, the data were reprocessed. Some clustering based on the Ward method were obtained, and then were studied case by case. The correlations study preceding the Generalized Linear Model (GLM) application was also made. Finally, as a variable was not fully completed, some Data Science methods such as CART (Classification And Regression Trees) and Random Forest have been deployed in order to solve the issue. As a GLM was used, some pricing work were tackled. Following the visualization of the residuals obtained with the frequency model method, the same Data Science methods as the one used for the variable completion were called to obtain an adapted cost model. In this context, a Gradient Boosting Model (GBM) algorithm is used to model each warranty's cost. This work leads us to the resutls analysis after the cost-frequency model was applied. Echoing the questionable results obtained with the residual analysis, the GLM seemed also unadapted for the frequency modelling, due to the lack of data at disposal. A Random Forest method is finally applied in order to get a more realistic modelling. Then, the results are incorporated within the reinsurance program, and the reinsurer's and insurer's profitabilities are discussed. A method is set up to see if a better premium distribution among the warranties is possible to improve the reinsurer global result. Finally, the modelling results are implemented in the group's Business plan as part of the pillar 2 from the Solvency 2 directive, to observe the potential effects on the group's result and solvency ratio.

Mémoire complet