Mémoire d'actuariat

Tarification IARD avec des modèles de régression avancés
Auteur(s) KHOUGEA Danielle
Société Prim'Act
Année 2019
Confidentiel jusqu'au 15/05/2020

Résumé
La tarification IARD repose classiquement sur l'approche "fréquence-coût" avec, pour chacun de ces composants, un modèle linéaire généralisé (Generalized Linear Models, GLM). Ces derniers ont été introduits par Nelder et Wedderburn (1972) et adaptés par la suite à des problématiques qui relèvent du monde de l'assurance. L'objet de ce mémoire est de proposer, dans le contexte de la tarification dommage en assurance automobile, une alternative conçue sur la base d'un modèle de Réseau de Neurones Artificiels (RNA) et plus spécifiquement les réseaux de type Random Vector Functional Link (RVFL) : il s'agit d'une technique qui permet d'établir des dépendances, à la fois linéaire et non linéaires de haut niveau, entre les variables explicatives, et d'affiner le tarif. Cette étude vient compléter un mémoire réalisé sur le boosting (cf. De Lussac {2018}) dans le cadre de l'évaluation de l'impact d'un réseau d'experts face à ses concurrents en termes de coût de sinistres, dont il reprend les données.

Abstract
Property and Casualty insurance pricing classically relies on the "frequency-cost" approach, where each of its components is modelized with a Generalized Linear Model (GLM). GLMs were introduced by Nelder and Wedderburn in 1972 and subsequantly adapted to issues related to the insurance industry. In the context of auto insurance pricing, the aim of this study is to provide and alternative predictive model based on Artificial Neural Networks (ANN) and more specifically on Random Vector Functional Link Neural Network (RVFLNN) : this technique allows establishing high-level linear and nonlinear dependencies between the explanatory variables in order to refine the insurance rates. This thesis complements a study that was done on boosting (cf. De Lussac {2018}) within the framework of the impact of an experts' network assessment against its competitors in terms of cost claims and, from which the data was taken.