Mémoires d'Actuariat

Open data et Assurance santé : l’union fait la force ?
Auteur(s) HUYNH S.
Société ACTUELIA
Année 2021

Résumé
Mots clés : Assurance santé, Open data, Open DAMIR, tarification, enrichissement de base de données, MLG, données agrégées, prime pure, machine virtuelle. Il était une fois… Une mutuelle qui souhaitait étendre le tarif de quelques-uns de ses produits d’assurance santé préexistants à un périmètre national. En effet, bien qu’éclairée sur les prix pratiqués dans sa région de localisation, elle n’avait cependant pas cette expertise sur les régions voisines, et encore moins sur le reste de la France. Son budget était cependant limité et elle souhaitait faire le plus possible d’économies : envisager l’achat de données n’était donc pas son choix favori. Elle décida alors de s’orienter vers les « Open data », données publiques facilement accessibles et qui plus est, gratuites. Elle y trouva alors une opportunité. Après état des lieux des alternatives et informations légales obtenues, elle sélectionna dans la vastitude des possibilités l’Open DAMIR, par sa complétude. Équipée de la puissance de calculs de son nouvel outil que constitue la machine virtuelle nouvellement acquise, elle s’attaqua alors à une démarche de tarification dans un but ultime d’extension de primes pures : détermination des différents segments tarifaires, études et retraitements de la matière première que sont les données à sa disposition (internes et externes), mise en cohérence de jeux de données, choix de méthodes de tarification (modèles linéaires généralisés ou calculs statistiques directs) et enfin, construction de coefficients de déformation de tarifs pour modéliser l’effet « région ». Le chemin sera cependant semé d’embûches avec un adversaire de taille : le traitement des données agrégées.

Abstract
Keywords: Health insurance, Open data, Open DAMIR, pricing, data enrichment, GLM, aggregate data, net premium, virtual machine. Once upon a time… There was a mutual insurance company which wanted to extend the prices of some of its existing health insurance products national-wide. While the company was familiar with pricing business in the region of France that it has been operating in for years, it had little experience when it came to pricing for neighbouring areas and even less when it came to the rest of France. As its budget was limited and savings were to be optimized, buying databases was not its first choice. The company then decided to use “Open data” because they are easily accessible and completely free data sources. It thus found an opportunity. It chose the Open DAMIR database because of its comprehensiveness after performing some legal and situational analysis of the possible database alternatives. Equipped with the computational power of its newly-found tool – a virtual machine – it took the following pricing steps to determine the net premiums for its business expansion, which included: identifying various pricing segments; stuying and altering the raw materials which are the external and internal data at its disposal; matching databases; choosing the pricing methods (generalized linear regressions or straight statistical calculations); and building the adjustment factors to model the “area” effect on premiums. Nevertheless, it was not an easy task and the path was strewn with pitfalls with a challenging opponent: how to process aggregate data.

Mémoire complet