Mémoires d'Actuariat

Apprentissage en ligne et par Renforcement pour l'Optimisation des prix en Assurance Automobile
Auteur(s) NGARBAYE I.
Société Axa Global Direct France
Année 2021
Confidentiel jusqu'au 17/11/2026

Résumé
La montée en puissance des canaux digitaux exacerbe la compétition sur le prix, faisant de la sophistication des politiques de pricing, un facteur clé du succès de l’assureur direct, aux côtés du ciblage commercial, des coûts et de l’expérience client (De Malleray, 2017). Ces stratégies sophistiquées de pricing sont basées sur une segmentation post-vente dont le seul but est d’estimer l’élasticité-prix ou la sensibilité des clients du portefeuille à la revalorisation du tarif. De plus, avec le marché en ligne, l’assureur direct peut connaître les stratégies de segmentation des concurrents, leur vision du risque, et intégrer dans ses stratégies le prix de la concurrence sur les différents segments de risque considérés (De Malleray, 2017). Elles souscrivent ainsi à une vision du tarif reposant sur le trinôme coût/concurrence/demande (Longo, 2012). Ce travail propose une nouvelle méthode d’optimisation tarifaire à la souscription de nouveaux contrats automobile en assurance directe. Méthode basée sur les fonctions de demande d’assurance et dont l’efficacité repose en grande partie sur la précision de la modélisation du comportement client. Il a apporté des réponses à des points liés à la modélisation dynamique du comportement de conversion à l’aide d’un modèle de machine learning; sont explorées les techniques d’appariement afin d’avoir une compréhension plus fiable de la sensibilité individuelle aux variations de prime dans le cas du calcul des élasticités-prix ; une application du problème de bandits contextuels est réalisée, afin d’intégrer une vision de l’optimisation tarifaire individuelle basée sur le dilemme exploration-exploitation ; et enfin, sont explorées les possibilités de mise à jour d’un modèle dans le contexte d’afflux continu de données où il existe le risque de changement de distribution dans les données. Mots-clés: concurrence, pricing, machine learning, exploration-exploitation, bandit, optimisation individuelle. 

Abstract
The rise of digital channels is exacerbating price competition, making the sophistication of pricing policies a key factor in the success of the direct insurer, alongside commercial targeting, costs, and pricing. customer experience (De Malleray,2017). These sophisticated pricing strategies are based on post-sale segmentation, the sole purpose of which is to estimate the price elasticity or the sensitivity of portfolio customers to price increases. In addition, with the online market, the direct insurer can know the segmentation strategies of competitors, their vision of risk, and integrate into its strategies the price of the competition on the different risk segments considered (De Malleray, 2017). They thus subscribe to a vision of the tariff based on the trinomial cost / competition / demand (Longo, 2012). This work proposes a new method of tariff optimization for the subscription of new automobile contracts in direct insurance. A method based on insurance demand functions, the efficiency of which depends largely on the accuracy of the modelling of customer behaviour. We provided answers to points related to the dynamic modelling of conversion behaviour using a machine learning model; matching techniques are explored in order to gain a more reliable understanding of individual sensitivity to premium variations in the case of the price elasticity calculation ; an application of the contextual bandit problem is carried out, in order to integrate a vision of individual tariff optimization based on the exploration-exploitation dilemma; and finally, the possibilities of updating a model are explored in the context of a continuous influx of data where there is the risk of a change in distribution in the data. Keywords: competition, pricing, machine learning, exploration-exploitation, bandit, individual optimization.