Mémoire d'actuariat

Une nouvelle méthode de classification permettant de cibler des actions de prévention
Auteur(s) GAUCHON Romain
Société Actuaris
Année 2018

Résumé
Pour qu'une action de prévention soit efficace, il est important de cibler des personnes et d'identifier leurs besoins, afin de proposer des programmes de prévention adaptés. Ce mémoire présente une méthode de classification innovante basée sur les prestations pour répondre aux contraintes pratiques liées à la prévention dans le domaine de l'assurance santé : elle devrait être non supervisée, complémentaire aux statistiques descriptives usuelles et entièrement interprétable. Elle se déroule en trois temps : Tout d'abord, il faut retraiter les données relatives aux prestations santé versées par l'organisme assureur afin d'obtenir une matrice où chaque ligne représente la consommation d'un assuré, en comptant les fréquences de consommation de chaque acte santé. La seconde étape consiste à réduire la dimension de la matrice précédente, afin de faciliter les interprétations et d'améliorer la qualité de la classification. Les algorithmes NMF (Non negative Matrix Factorisation) remplissaient bien ce rôle. Enfin, elle utilise la matrice de dimension réduite pour classifier nos assurés à l'aide d'une carte de Kohonen. Une cartographie de l'ensemble de nos assurés constituée de quinze à vingt groupes de risque homogènes est alors obtenue. Cette méthode offre une visualisation naturelle de notre portefeuille. En ce sens, elle est complémentaire aux statistiques descriptives classiques puisqu'elle décrit graphiquement les groupes de risques sous-jacents. Les classes obtenues sont facilement interprétables et peuvent permettre par exemple d'identifier les personnes âgées les plus sujettes au risque de chutes et de leur proposer des actions de prévention adaptées.

Abstract
A prevention plan cannot be efficient without being targeted. This context has incited us to develop a new clustering method. It has to be unsupervised, complementary with the usual descriptive statistics and easy to interpret in order to fit with the practical constraints of prevention. The method developed in this actuarial thesis has three steps. First, it converts a typical insurance data set to a new matrix. Each line of this matrix describes the consumption of one policyholder (in this thesis, we used the consumption frequency). Secondly, we reduce the dimension of the new problem, using the NMF (Non-negative Matrix Factorisation) algorithms. These steps help to interpret the final clusters. Moreover, it increased dramatically the quality of the results. Finally, we cluster the policyholders using a Kohonen's self-organising map. We usually obtain among fifteen and twenty clusters. Kohonen's maps offer a natural visualisation of the results. Thus, it is easy to compare results obtained on two policyholders sample. In this way, the method can be seen as a new descriptive statistics tool. Also, by means of the dimension reduction, it is easy to interpret the clusters. Hence, this process can be used to target a tertiary prevention plan, for example on senior fall. The statistical description of the clusters can also lead to a better understanding of a class of risk and help to target a primary prevention plan.

Mémoire complet