Mémoire d'actuariat

Motor TPL Pricing using GLM for an Insurance Company in KSA
Auteur(s) GHAZELIAN N.
Société ACTUSCOPE
Année 2020
Confidentiel jusqu'au 10/06/2021

Résumé
Mots-clés: assurance automobile, régression, cout moyen, fréquence, modèles linéaires généralisés Ce mémoire a pour objectif de modéliser la prime pure pour le produit obligatoire TPL par des modèles linéaires généralisés pour une compagnie d’assurance en Arabie Saoudite. Le GLM méthode est largement connue et utilisée dans les pays Européens, cependant son utilisation en Arabie Saoudite et le MENA région est encore limitée. L’Arabie Saoudite principale source de revenus, dépend des échanges pétroliers ce qui rend le pays vulnérable face aux variations des prix du pétrole et à la non-renouvelable nature de ces ressources. Afin de diversifier l’économie, le gouvernement a établi en 2016 le plan Saudi Vision 2030. C’est anticipé d’avoir un impact positif sur les compagnies d’assurances. A cet égard, le rôle de la règlementation est devenu important. Récemment, cela a obligé les entreprises à cesser d’utiliser les méthodes classiques de tarification et plutôt baser les tarifs sur des modèles plus développés. De plus, un comité gouvernemental a étudié la possibilité d’utiliser la télématique pour l’assurance automobile. Une fois ce projet approuvé et mis en travail, les compagnies d’assurance seront confrontées par une large quantité de données avec d’innombrables de facteurs de risque. De ce fait, la tarification habituelle ne peut plus s’appliquer à ce stade. Les modèles linéaires généralisés ont la capacité de modéliser les interactions entre les variables. Dans cette thèse, nous développerons les différentes étapes suivies pour modéliser une structure tarifaire pour le produit TPL. Ce produit couvre les dommages matériels et corporels du tiers. Cependant, aucun indicateur n’est présent pour distinguer ces deux couvertures dans les données disponibles, nous n’étions pas capables d’évaluer ces couvertures séparément. Afin d’avoir un modèle stable, nous avons vérifié la qualité des données et nous avons effectué un data cleaning tout en effectuant une analyse descriptive des données. Ensuite, nous avons créé deux modèles distincts, l’un pour la fréquence des sinistres et l’autre pour le coût moyen. Les deux variables à modéliser sont le nombre de sinistres et la charge de sinistres tout en prenant en compte l’exposition. Nous avons ensuite expliqué comment les variables ont été sélectionnées dans les modèles et comment diffèrent modèles ont été comparés. En fin, une comparaison est effectuée entre les valeurs observées et prédites pour valider le modèle choisi.

Abstract
Key Words: motor insurance, third party compulsory product, generalized linear model, GLM, claims Frequency, claims Severity, rating plan The objective of this report is to model the burning cost or the pure premium for Motor Third Party Compulsory product using generalized linear model for an insurance Company in the Kingdom of Saudi Arabia. The GLM method is widely known and used in European countries however its use in the KSA or MENA countries is still limited. For this reason, this paper includes the model-building process from start to finish. Saudi Arabia’s main source of income relies on oil trades which make the country vulnerable to oil price changes and to the non-renewable nature of this resource. In order to divert the economy from oil exportation, the country launched in 2016 the plan called Saudi vision 2030. It is expected to have a positive impact on the insurance companies; in this regard the insurance company’s regulatory role became important. Recently, it required the companies to have more developed pricing models rather than relying on the classical pricing methods. In addition, the aggregators will put the insurance companies under pressure to have competitive prices. Furthermore, a government committee studied the option of using telematics for usagebased motor insurance. Once this project is approved and implemented, the insurance companies will face a huge amount of data with countless risk factors. Using classical methods would be impossible at that stage. In this dissertation, we will elaborate the different steps followed to build the rating plan of the TPL product. This product covers the third party’s material and bodily damage. However, given the lack of this information in the data, we were not able to price these covers separately. In order to have a steady model, we checked the quality of the data and performed a data cleaning while conducting an exploratory data analysis. Then, we created two separate models, one for the claims frequency and another for the claims severity. The two variables to model were the number of claims and the ultimate claims amount taking into consideration the exposure. We explained how the variables were selected in the models and how different models were compared. In the end, we validated these models by comparing the observed and predicted values by rating category.