Mémoires d'Actuariat

Construction et exploitation d’un véhiculier dans un modèle de Machine Learning interprétable pour l’optimisation tarifaire automobile
Auteur(s) DOMAVO T.
Société Generali France
Année 2025

Résumé
Les rapports annuels 2020-2022 de France Assureurs signalent une tendance croissante des prestations en assurance automobile, incitant les assureurs à ajuster leurs primes pour mieux aligner celles-ci avec le profil de risque des assurés. Cette situation nécessite une réévaluation et une amélioration des méthodes de tarification actuelles afin d'identifier plus précisément les risques encourus par les assurés. La littérature sur les mémoires d’actuariat souligne que l'intégration d'une variable telle que le véhiculier, représentant le risque associé aux véhicules, dans les modèles de tarification améliore significativement leurs capacités prédictives. Par ailleurs, l'essor des modèles de Machine Learning présente une opportunité stratégique majeure pour les assureurs, particulièrement en raison des enjeux critiques liés à la gestion des risques. Ces modèles avancés peuvent optimiser la prédiction des indicateurs de risques clés en assurance automobile, tels que la fréquence et le coût moyen des sinistres. Cependant, l'utilisation de ces modèles sophistiqués pose un défi important en termes de transparence, souvent qualifiés de "boîte noire", ce qui complique l'interprétation des résultats et la prise de décision éclairée. L'objectif principal de ce mémoire est d'optimiser la tarification en assurance automobile en développant et intégrant un véhiculier afin d’améliorer les modèles prédictifs existants. Ensuite, cette étude se concentre sur la gestion des risques associés aux profils des assurés en utilisant un modèle de Machine Learning interprétable, le Modèle Additif Neuronal. Ce modèle est spécialement conçu pour concilier performance et transparence, en acceptant une légère réduction de précision pour favoriser une meilleure interprétabilité. Cette approche vise à faciliter les décisions relatives aux politiques tarifaires, garantissant ainsi une meilleure adéquation entre les primes proposées et les risques réels. En conclusion, ce mémoire propose des améliorations méthodologiques pour la tarification en assurance automobile, en mettant l'accent sur l'intégration de données détaillées et l'application d’un modèle de Machine Learning interprétable, dans le but de renforcer à la fois la précision des prédictions et la transparence des décisions tarifaires.

Abstract
France Assureurs' 2020-2022 annual reports point to a growing trend in automobile insurance benefits, prompting insurers to adjust their premiums to better align them with the risk profile of policyholders. This situation requires a re-evaluation and improvement of current pricing methods in order to more accurately identify the risks incurred by policyholders. The literature on Actuariat’s dissertations emphasizes that the integration of a variable such as vehicle classification, representing the risk associated with vehicles, into pricing models significantly improves their predictive capabilities. Moreover, the rise of machine learning models presents a major strategic opportunity for insurers, particularly because of the critical issues related to risk management. These advanced models can optimize the prediction of key risk indicators in automobile insurance, such as the frequency and average cost of claims. However, the use of these sophisticated models poses a significant challenge in terms of transparency, often referred to as the "black box", which complicates the interpretation of results and informed decision-making. The main objective of this thesis is to optimize car insurance pricing by developing and integrating a vehicle classification to improve existing predictive models. Then, this study focuses on the management of risks associated with the profiles of insured persons using an interpretable Machine Learning model, the Neural Additive Model. This model is specially designed to reconcile performance and transparency, accepting a slight reduction in precision to promote better interpretability. This approach aims to facilitate pricing policy decisions, thus ensuring a better match between the proposed premiums and actual risks. In conclusion, this thesis proposes methodological improvements for car insurance pricing, focusing on the integration of detailed data and the application of an interpretable Machine Learning model, with the aim of strengthening both the accuracy of predictions and the transparency of tariff decisions.

Mémoire complet