Mémoire d'actuariat

Anticipation des changements de notes des obligations du portefeuille d\'un assureur par méthode de machine learning
Auteur(s) LAUR Morgane
Société OPTIMIND
Année 2018

Résumé
La data science est un thème qui gagne en popularité depuis les dernières années, notamment dans le monde de l\'assurance. Diverses problématiques actuarielles font l\'objet de sujets exploratoires afin d\'être résolues par des modèles de machine learning, ce qui fait de l\'actuariat et de la data science deux disciplines de plus en plus complémentaires. L\'objectif de ce mémoire est de développer une méthode de machine learning pour améliorer le SCR de spread dans le cadre de la directive Solvabilité II, la réforme européenne de la réglementation prudentielle s\'appliquant au secteur de l\'assurance. Le risque de spread de la part de risque issue des instruments financiers expliquée par la volatilité des spread de crédits par rapport à la courbe des taux d\'intérêts sans risque. Il s\'agira plus précisément de prédire les changements de note des obligations détenues par les assureurs pour anticiper la hausse du SCR engendrée par ces changements, et pour une meilleure efficacité de leur gestion d\'actifs. L\'analyse débute par la construction d\'une base de données sur laquelle seront prédits les changements de notes. Ces données proviennent du terminal Bloomberg, interface fournissant les actualités et les données financières en temps réel des entreprises et des institutions gouvernementales. L\'extraction de données pertinentes représente un travail important du fait que le changement de note, phénomène relativement singulier, ne peut être expliqué que par le biais de données de qualité. Le prétraitement des données, qui consiste à effectuer des modifications sur les données brutes pour former une base d\'étude, ainsi que les différents algorithmes prédictifs, sont mis en oeuvre sur le logiciel R. Cet outil d\'analyse statistique et graphique est distribué librement et est largement utilisé dans l\'industrie compte tenu de sa flexibilité ainsi que de ses nombreuses fonctionnalités. Divers algorithmes ont été implémentés pour modéliser le changement de note, celui que nous retiendrons étant le gradient boosting dont le principe sera détaillé par la suite. Ce procédé a déjà fait ses preuves sur diverses problématiques prévisionnelles. Les prédictions finales sont analysées par le biais métrique d\'erreur, le but étant d\'apprécier la qualité du modèle. Une fois que sa performance est vérifiée, le modèle est ensuite utilisé dans le cadre d\'un calcul de SCR de spread. Une comparaison entre SCR réel et SCR prédit sera finalement établie. Elle permettra de mettre en exergue l\'utilité de la considération des futurs changements de notes dans la gestion des actifs et dans l\'optimisation du SCR d\'un assureur.

Abstract
Data science has been growing in popularity in the past years, notably in the insurance industry. Various actuarial problems are subject to exploratory and research topics in order to be solved by machine learning models, which makes actuarial science and data science two disciplines increasingly complementary. The objective is to develop a statistical learning method to improve the SCR spread under Solvency II, the European reform of prudential regulation applied to the insurance sector. Spread risk is the share of risk arising from financial instruments, explained by the volatility of credit spreads in relation of the risk-free interest rate curve. More precisely, the process will be to predict changes in bonds rating held by insurers in order to improve their asset management and to anticipate the increase in SCR caused by these changes, using predictive algorithms. The first step of this analysis is to build an exploitable database on which the rating migrations will be predicted. This data come from the Bloomberg terminal, an interface that provides news and real-time financial data for companies and government institutions. The extraction of relevant data represents an important work since the change of rating, which is a relatively singular phenomenon, can only be explained by quality data. The pre-processing of the data, which consists of making changes on the raw data to form a study base, as well as the different predictive algorithms, are implemented on the software R. This statistical and graphical analysis tool is open sourced and is widely used in the industry given its flexibility as well as its many functionalities. Various algorithms are implemented for the downgrading modeling, the final one being the gradient boosting8, the principle of which will be described in details below. This method has already proved its worth on various predictive problems. The final predictions are analyzed by means of wisely selected error metrics, the aim being to assess the quality of the model. Once its performance is confirmed, this mode is then adopted as part of a market SCR calculation. A comparison between actual SCR and predicted SCR will finally be established. It will highlight the usefulness of considering future rating changes in asset management and optimizing an insurer\'s SCR.

Mémoire complet