Mémoire d'actuariat

La détection de fraude en arrêt de travail
Auteur(s) BELOT Cassandra
Année 2019
Confidentiel jusqu'au 13/03/2024

Résumé
La fraude s'avère être un véritable fléau pour les compagnies d'assurance, notamment en arrêt de travail. En effet, les arrêts non justifiés ou abusifs représentent une charge pour l'ensemble des acteurs. Ils impliquent une désorganisation pour l'entreprise, un surcroît de travail manifeste pour les salariés en poste, un équilibre du ratio cotisations / prestations / provisions mis à mal et une lourde implication financière à la charge de toutes les parties. Malgré les dispositifs mis en place pour les détecter, la fraude reste un délit très délicat à démontrer. Les compagnies d'assurance s'appuient en général sur des rapports d'experts, des anomalies remontées par les gestionnaires ou encore des outils d'informatiques pour créer une alerte. Cependant, l'évolution croissante du nombre de sinistres ne permet pas toujours aux équipes internes de contrôler toutes les déclarations dans les délais. Disposer d'un profil frauduleux clairement établi, permettrait à l'assureur de l'intégrer dans sa tarification, et par finalité de pérenniser sa relation clients, en leur proposant des offres et produits adaptés. Aussi, ces systèmes peuvent être optimisés. Dans une ère où "demain" est synonyme d'"innovation", et où la masse de données en cesse d'augmenter, les assureurs se dirigent, de plus en plus, vers des méthodes d'analyses plus avancées, notamment par le biais de la Data Science. Ainsi, ce mémoire a pour but de détecter un arrêt de travail frauduleux ou injustifié aux vues de ses données, en s'appuyant sur des méthodes de Machine Learning. A partir des données relatives à la fraude recueillies, il s'agira de construire plusieurs algorithmes de détection de fraude (GLM, arbres, forêts, Naïve bayes, XGboost), en vue d'établir des profils de fraude, d'identifier de nouvelles variables impactantes et d'optimiser le process de détection actuel du du client. Pour ce faire, nous intervenons sur les données de notre client, un groupe de protection social, à la Direction Actuariat, ayant en charge le pilotage opérationnel des produits prévoyance collective. Ce projet, motivé par le taux actuel de fraude trop élevé pour ce client, s'inscrit dans une perspective parallèle de satisfaction des demandes et attentes de celui-ci.

Abstract
Fraud turns out to be a real scourge for insurance companies, especially in relation to sickness absence. Indeed, unjustified of abusive sickness absences represnt a burden for all the actors. They imply disorganization for the company, a clear increase of work for the employees in position, undermining of the balance of the claims to premiums / benefits / reserves, and heavy financial implication at the expense of all the parties. Despite the devices put in place to detect them, fraud remains a very delicate offense to prove. Insurance companies usually rely on expert reports, anomalies reported by managers or computer tools to create an alert. However, the increasing evolution of the number of claims does not always allow the internal teams to control all declarations in time. Moreover, a clearly established fraudulent profile would be integrated in insurer's pricing. Ultimately, it would allow customer relationships to be sustained, by offereing them tailored offers and products. Also, these systems can be optimized. In an era where "tomorrow" is synonymous with "innovation", and where the mass of data continues to grow, insurers are moving increasingly, towards more avanced methods of analysis, particularly through of Data Science. So, this thesis aims to detect a fraudulent or unjustified sickness absence in view of the data, relying on Machine Learning methods. Precisely, from the collected fraud data, it will be about building several fraud detection algrithms (GLM, trees, forests, Naïve Bayes, XGBoost), in order to establish fraud profiles, identify new impacting variables and optimize the client's curent detection process. In this context, we intervene on the data of our client, a social protection group, at the Actuarial Department, which is in charge of the operational management of the collective protection products. This project, motivated by the current rate of fraud whch is too high for our client, is part of a parallel perspective of its demands and satisfying expectations.