Mémoires d'Actuariat

Création d’une valeur au niveau foyer en assurance
Auteur(s) BOULLET G.
Société THELEM ASSURANCES
Année 2022
Confidentiel jusqu'au 16/11/2024

Résumé
A l’origine, quel que soit le contrat souscrit, le tarif était calculé en fonction du risque. Le véhicule et le conducteur pour le contrat automobile, l’habitation et le souscripteur pour l’assurance habitation, ou encore les bénéficiaires pour une assurance santé. Au fil des années avec une segmentation de plus en plus fine, une vision client a été amenée. Une vision plus large est étudiée ici avec un périmètre étendu au foyer en observant sa rentabilité sur une période donnée et l’évolution de ses caractéristiques pour essayer d’en déterminer un comportement. L’étude consistera donc à déterminer une classification des foyers à l’aide de modèles d’apprentissage non supervisées (K-means, Meanshift, DBSCAN, Propagation d’affinité, Classification ascendante hiérarchique) en fonction de caractéristiques prédéfinies. Une fois les classes interprétables, elles seront testées dans le modèle de tarif du produit automobile comme un critère tarifaire. Que le test soit concluant ou non, d’autres utilités pourraient être envisagés pour les résultats de la classification retenue. Le problème restant sera d’avoir l’historique nécessaire pour la construction de cette classification. Il sera donc intéressant d’envisager et de tester des modèles de prédiction pour anticiper les valeurs des foyers et utiliser cette donnée, si elle a un impact technique, au plus tôt. Mots clés : Rentabilité, Assurance automobile, foyer, comportement, apprentissage non supervisé, prédiction, classification, arbre de décision, matrice de confusion, modèle linéaire généralisé, modèle de Tweedie, k plus proches voisins, régression logistique.

Abstract
Initially, whatever the contract subscribed; the price was calculated according to the risk. For instance, cars and drivers for motor insurance contract, accommodations and subscribers for home insurance coverage or beneficiaries for health insurance. Over the years and with a narrower segmentation, a customer vision has been developed. A larger vision is studied here with an extended scope to the households by observing its profitability over a given period and the evolution of its characteristics helping to determine its behavior. This study will consist in defining household’s classifications with the support of unsupervised learning models (K means, MeanShift, DBSCAN, Affinity Propagation, Hierarchical Ascending Classification) based on predefined characteristics. Once the classifications are defined, they will be tested in the automobile product tariff as a criterion. Whether the test is successful or not, other uses could be considered for the results of the classification chosen. The remaining issue will be to have enough data record to build this classification. Therefore, it will be interesting to consider and to test prediction models in order to anticipate household values and to use this data in case of technical impact at the soonest. Keys words : Profitability, motor insurance, household, behavior, unsupervised learning model, prediction, classification, decision trees, confusion matrix, general linear model, Tweedie model, k-nearest neighbors, logistic regression.