Mémoire d'actuariat

Apport de l'Open Data à la modélisation de la consommation médicale
Auteur(s) YERLE L.
Société ADDACTIS
Année 2020

Résumé
En assurance santé, une difficulté majeure est le manque de données que l'assureur possède concernant l'assuré. Lors de la signature d'un contrat, l'assuré ne partage que très peu d'informations avec l'assureur. Dès lors, les assureurs doivent mettre en place des méthodes de tarification innovantes pour proposer un tarif adapté. Le développement de l'Open Data offre de nouvelles opportunités aux assureurs. Ces nouvelles données peuvent être utilisées afin de compenser le manque d'information. En France, le choix a été fait de publier les données des prestations de santé pour lesquelles tout ou une partie du montant est pris en charge par l'Assurance Maladie. Cette base de données, alimentée mensuellement, est en 2019 la base de données de santé ouverte au public la plus conséquente au monde et est appelée base Damir. C'est dans cette optique que se déroule ce mémoire. Il est abordé l'importance pour les assureurs de passer à une pratique de tarification utilisant des méthodes d'apprentissage automatique. De plus, utiliser ces méthodes, qualifiées d'innovantes comparées aux modèles linéaires généralisés initialement utilisés, permet de faire intervenir les données externes Open Data dans le processus de tarification. Ce mémoire tente d'apporter une réponse au questionnement que pourrait se poser un nouvel acteur souhaitant démarrer une activité d'assurance complémentaire : l'utilisation de la base Damir comme seul historique des sinistres permet-il d'effectuer une tarification fine, juste envers tous les potentiels assurés ? Une comparaison est effectuée entre une tarification n'utilisant que des données provenant d'un historique de sinistres d'un assureur, et une seconde tarification après apport de données ouvertes à cette même base de données.

Abstract
In France, healthcare insurance involves public and private agents. Thus, private agents do not have to take the whole cost into account, but only a part of it. When a contract is signed by an insured, only few elements are provided by the insured to the insurer. Then, insurers must implement innovative methods to provide a price that is suitable to the insured. The growth of open data provided online enables insurers to develop new methods which could counterbalance the lack of information about the insured. For a while, France has been late about opening health data to public. A few countries like the United Kingdom, Canada or Denmark, set different ways to share health data in order to give to the insured more autonomy, and greater responsibility. In France, a choice has been made to share data of all health benefits which benefited from a reimbursement from the french health fund. This database, updated monthly, was in 2019 the greatest open health database, and called Damir database. Therefore, this master thesis broaches the importance for insurers to tackle new pricing methods, especially the ones using machine learning. Furthermore, using these innovative methods enables to involve open data in the pricing process. In this master thesis it is tried to answer the following question: could a new insurer use only open data as a whole historic to assess a price for its insurance policies? The Damir database does not gather the entire medical data available on the web. Indeed, some data related to prevalence are also available online. While using a database provided by an insurer, a comparison is made between pricing with or without open data.

Mémoire complet