Mémoires d'Actuariat

Modélisation du risque hospitalisation sur les données open source de la Sécurité Sociale
Auteur(s) ADOU A-E
Société SiA Partners
Année 2020

Résumé
Le faible taux de prise en charge des soins hospitaliers par les complémentaires santé pose des limites à l’appréhension du risque hospitalisation. Pourtant, ce risque reste stratégique dans le cadre du pilotage des régimes frais de santé puisqu’il représente un peu plus d’un tiers des prestations servies par les organismes complémentaires. Dans la perspective d’améliorer la connaissance de ce risque, ce mémoire propose d’analyser la sinistralité observée à l’échelle nationale en s’appuyant sur les données open source de la Sécurité sociale, retraçant la consommation de soins hospitaliers par profil d’individu. Une première partie s’attachera à décrire le contexte de prise en charge de l’hospitalisation en France, ainsi que les tendances de consommation des soins hospitaliers issues de l’analyse des données. Ensuite, afin d’évaluer l’apport du machine learning dans le cadre de la fiabilisation des tarifs, trois stratégies tarifaires basées sur les modèles linéaires généralisés (GLM) seront mises en place : 1. Une tarification globale du risque sans segmentation des actes hospitaliers qui servira de benchmark pour l’évaluation des performances des tarifs concurrents ; 2. Une tarification selon un regroupement des actes en sous-postes de soins usuels ; 3. Une tarification selon une segmentation des actes découlant d’un algorithme de classification non supervisé : HDBSCAN. Ainsi, cette dernière tarification a vocation à challenger le schéma actuel de modélisation du risque hospitalisation pour une meilleure adéquation risque-tarif. En effet, celle-ci vise à proposer une nouvelle segmentation de modélisation optimisant l’homogénéité des groupes d’actes formés en matière de fréquence de consommation et de coût moyen. Mots clefs: hospitalisation, open source, tarification, GLM, classification non supervisée, HDBSCAN.

Abstract
Because supplementary health insurance organizations only cover a small percentage of the costs associated with hospital care, their understanding of the risk of hospitalization is limited. However, understanding this risk is important in the context of healthcare cost schemes because hospitalization costs accounts for slightly more than a third of the benefits provided by supplementary health insurance organizations. In order to improve knowledge of this risk, this paper analyses the claims experience observed on a national scale by using Sécurité sociale data, tracing the consumption of hospital care by individual profile. The first part will describe hospital care coverage context in France, as well as the trends in the consumption of hospital care resulting from the analysis of the data. Then, in order to evaluate the use of machine learning in predicting hospital care pricing, three pricing strategies based on Generalised Linear Models (GLM) will be put in place : 1. Global risk pricing without segmentation of hospital procedures, which will serve as a benchmark for evaluating the performance of competing rates ; 2. Pricing according to a classification of the acts into sub-categories of usual care ; 3. Pricing according to a segmentation of acts resulting from an unsupervised classification algorithm : HDBSCAN. The third pricing strategy is intended to challenge the current hospitalization risk modeling scheme to ensure a better risk/price match. Indeed, it aims to propose a new modeling segmentation that optimizes the homogeneity of the categories of care formed in terms of frequency of consumption and average cost. Keywords: hospitalization, open source, pricing, GLM, unsupervised classification, HDBSCAN.

Mémoire complet