Mémoire d'actuariat

Comparaison de différentes méthodes pour la modélisation de la prime pure d'un produit risque aggravé en assurance automobile
Auteur(s) ALLAIRE Oksana
Société Generali France - L'EQUITE
Année 2020
Confidentiel jusqu'au 31/01/2022

Résumé
Depuis 1958, la garantie "Responsabilité Civile" de l'assurance automobile est obligatoire en France. Ce marché représente un secteur très compétitif. En effet, de nombreux acteurs (agents généraux d'assurance, courtiers, mutuelles, bancassureurs, vente directe, etc...) proposent des tarifs de plus en plus compétitifs et attractifs pour les clients. Dans le but d'améliorer continuellement les tarifs proposés, tout en restant solvables, les assureurs doivent affiner leur segmentation. Celle-ci consiste à créer des classes de risques homogènes qui regroupent des individus pour lesquels la sinistralité est similaire, et qui paieront donc la même prime. Afin de réduire le montant des sinistres payés, les assureurs cherchent à attirer les profils les moins risqués. Par conséquent, certains conducteurs peuvent se voir refuse la souscription d'une assurance, ou se faire résilier leur assurance en cours en cas de risque trop important (coefficient de réduction-majoration (CRM) trop élevé, non-paiement de prime, sinistres trop fréquents, fausse déclaration, graves infractions au Code de la route (conduite en état d'ébriété, conduite sous l'emprise de stupéfiants, délits de fuite, excès de vitesse)). Cependant, ces conducteurs sont tout de même tenu à l'obligation d'assurance exigée par le code de la Route. C'est la raison pour laquelle il est intéressant de savoir tarifer correctement ces risques dits "aggravés". L'objectif de ce mémoire est d'analyser et de comparer plusieurs méthodes de tarifications sur le marché du risque aggravé. Dans un premier temps, le marché de l'assurance automobile en France, ses spécificités et ses principaux acteurs sont exposés. Puis, après avoir analysé la base de données à disposition, la modélisation de la prime pure est développée pour les bris de glace et dommages tous accidents. Le modèle linéaire généralisé, qui est le modèle le plus utilisé par les assureurs pour tarifer leurs produits est présenté et appliqué aux données. Ensuite, certaines méthodes d'apprentissage statistique sont abordées : les arbres de classification et de régression CART et les forêts aléatoire. Enfin, la dernière partie de ce mémoire est consacrée à la comparaison des différents résultats obtenus.

Abstract
Since 1958 in France, the "Third Party Liability" coverage of car insurance policies is compulsory. This market is a very competitive sector. Indeed, many parties (general insurance agents, insurance brokers, mutual insurance companies, bank-insurers, direct sales, etc.) offer increasingly competitive and attractive rates for customers. In order to contiuously improve the rates offered, while remaining solvent, insurers must refine their segementation. This consists in creating homogeneous risk classes that bring together people for whom the loss experience is similar, and who will therefore pay the same premium. In order to reduce the amount paid for the claims, insurers seek to attract least risky profiles. Therefore, some drivers may be refused by insurances, or their current contract may by terminated if the risk too high (excessively high bonus-malus, non-payment of premium, too frequent claims, fraudulent misrepresentation or serious traffic offenses, under the French Highway Code, to suscribe to an insurance policy. This is the reason why it is interesting to know to correctly price these so-called "aggravated" risks. The purpose of this writings is to annalyze and compare several pricing methods in the aggravated risk market. First, the car insurance market in France, its specificities and its main parties are going to be described. Then, after analyzing the database, pure premium modelling is developed for glass breakage and all accident damages. The generalized linear model, which is the model most used by insurers to price their products, is presented and applied to the data. Then, some Machine Learning methods are introduced: classification and regression trees and random forests. Finally, the aim of the last part of this writings is the comparison of the different obtained results.