Mémoires d'Actuariat

Application des méthodes de Machine Learning dans le pilotage de portefeuille Cas en assurance transport
Auteur(s) KHAMPHANH J.
Société CHUBB
Année 2021

Résumé
L’objectif de ce mémoire est de développer une preuve de concept pour l’utilisation de méthodes de Machine Learning dans le pilotage de portefeuille de risques d’entreprises. Elle a pour vocation à s’intégrer aux processus existants de revue de la profitabilité. Dans un premier temps l’emploi de méthodes d’analyses factorielles et d’arbres de décisions a permis de synthétiser les données du portefeuille. L’utilisation d’un algorithme de suréchantillonnage a permis de palier au déséquilibre de la base de données pour améliorer la détection des profils compte tenu de la part faible de comptes non-profitables du portefeuille. Dans un second temps, l’utilisation d’algorithmes tels que les SVM, des k-Means et de la CAH a permis de mettre en lumière des profils de comptes sous tarifés en tenant compte de la rentabilité cible ajustée du coût du capital. Notre proposition d’une correction partielle des poches de sous-tarification a permis de cibler les actions sur le portefeuille et de gagner en rentabilité sur certains segments. La priorité était donnée à la détection des comptes sous tarifés, mais l’utilisation de ces méthodes permettrait également de repérer les zones sur tarifés. Une action sur ces poches présenterait également un intérêt dans un environnement concurrentiel en s’assurant d’une meilleure adéquation du modèle de tarification. Enfin, cette méthode pourrait être une base de travail pour l’utilisation combinée du Machine Learning et des GLM. Avec une approche de scoring, la méthode permettrait de profiter des qualités prédictives des algorithmes d’apprentissages tout en ayant un modèle de tarification transparent.

Abstract
The objective of this paper is to develop a proof of concept for the use of Machine Learning algorithms in portfolio management of commercial lines risks. They are meant to be integrated in existing portfolio review processes. In a first stage, the use of factor analysis and decision trees has permitted to summarise the portfolio’s data. In our case, the portfolio under analysis only had a few under-priced accounts. To overcome the unbalanced dataset, a synthetic minority over-sampling technique has been used to improve the detection of those profiles. In a second stage, algorithms such as SVM, k-Means, and Hierarchical Clustering have been used to detect the profiles of under-priced accounts with regards to return on risk adjusted capital. Our proposition of a partial correction of the under-priced areas allowed to pinpoint actions on the portfolio and improve profitability in certain segments. The priority was given to the detection of under-priced accounts, however these methods could also be used to spot over-priced areas. Actions on those parts would be of interest in a competitive environment to ensure the best adequacy of the rating model. Finally, this approach could be a basis for the combined use of Machine Learning and GLMs. With a scoring approach, the methodology will allow for the use of the predictive capacity of Artificial Intelligence techniques while having a transparent rating model.

Mémoire complet