Développement de modèles de risque – La prochaine génération

  • 72% des sociétés financières britanniques utilisent ou développent déjà des applications d'IA/ML.
  • Les Fintechs et les banques Challenger sont plus avancées dans l'utilisation de l'IA/ML que les grandes banques.
  • Les modèles basés sur l'IA/ML présentent des caractéristiques différentes des modèles traditionnels, notamment en termes d'échantillonnage, de segmentation et de classement.

En fait, une récente enquête menée par la Banque d’Angleterre et la Financial Conduct Authority (FCA) a révélé que

72 % des sociétés financières britanniques utilisent ou développent déjà des applications d'IA/MLet cette tendance s’accélère à un rythme étonnant, avec

le nombre médian d'applications ML devrait monter en flèche de 3,5 fois au cours des trois prochaines années. Cette croissance n'est pas surprenante : les modèles d'IA/ML promettent de libérer des informations à partir de grandes quantités de données, permettant aux organisations financières de prendre des décisions plus intelligentes et plus éclairées et d'améliorer leurs stratégies de gestion des risques.

Développement de modèles de risque – La prochaine génération

Les résultats de l'enquête concordent avec les observations que j'ai faites dans le cadre de mon travail avec les institutions de services financiers britanniques. Cependant, j'ai constaté que la progression vers les méthodologies AI/ML est plus avancée au sein des Fintech et des Challenger Banks qui, contrairement aux High Street Banks, peuvent ne pas souffrir de limitations réelles dues aux systèmes existants ou de limitations perçues liées à leur statut IRB.

Les Fintechs et les banques Challenger ont généralement recruté des data scientists experts en technologie et possédant une compréhension approfondie de l'éventail de techniques avancées alternatives disponibles. Parallèlement, les grandes banques détiennent toujours un avantage significatif en termes d’expérience et de données. Ils ont des décennies d’expérience dans la création de modèles de crédit, ont établi des normes de développement de modèles et ont une compréhension approfondie des données sous-jacentes.

La question est désormais de savoir si les principes qui sous-tendent le développement des modèles traditionnels restent totalement pertinents pour la nouvelle génération de modèles basés sur l’IA, qui sont mathématiquement dérivés d’une manière complètement différente.

Développement de modèles  : traditionnel VS AI/ML

Le développement traditionnel des cartes de pointage adhère depuis longtemps à une conception d’échantillon méticuleuse, garantissant que les candidatures présentées pendant la fenêtre d’échantillonnage sont à la fois stables et reflètent les propositions les plus récemment reçues. Il est courant que des indices de stabilité de la population ou des indices de stabilité des caractéristiques soient calculés, ainsi que d'une étude détaillée de toute tendance qui s'étend au-delà des attentes raisonnables en matière de variation saisonnière. Cette approche repose sur la notion d'un échantillon de développement sur mesure adapté à la population spécifique qu'il dessert. La composition ou la combinaison segmentaire et sa spécificité sont considérées comme un facteur clé dans l’adéquation de l’échantillon de développement du modèle.

C’est là que les modèles affichent de meilleures performances lorsque l’échantillon d’apprentissage est étendu pour inclure des observations supplémentaires qui pourraient traditionnellement ne pas être considérées comme directement pertinenteséchantillon élargie par rapport aux modèles équivalents optimisés sur une période qui s'aligne simplement sur l'échantillon de test indépendant. Il est peu probable que cela se produise avec des modèles linéaires  !

Des résultats similaires peuvent être observés lorsque des segments ou des groupes adjacents sont ajoutés aux échantillons d’apprentissage. En effet, les modèles IA/ML prospèrent lorsqu’ils sont développés sur des ensembles de données vastes et diversifiés. Ces phénomènes auront des implications sur la conception de l’échantillon et le choix des exclusions dans le cadre des développements de modèles du futur, réécrivant potentiellement les idées reçues.

De même, de nombreux développements de cartes de pointage de crédit ont intégré la segmentation, grâce à laquelle un modèle est construit pour chacune d'un certain nombre de sous-populations (par exemple, fichier fin/fichier épais, propre/sale). L’avantage de cette approche est qu’en construisant plusieurs modèles, une certaine non-linéarité peut être capturée. Bien entendu, le choix de la segmentation n’est pas toujours évident et il est peu probable qu’il soit optimal, mais certaines améliorations de performances sont néanmoins obtenues. Étant donné que les modèles IA/ML sont construits en raison de leur capacité à capturer la non-linéarité, le besoin de modèles segmentés est ici limité, à moins qu'il n'existe des différences fondamentales dans la structure des données. Par conséquent, les modèles AI/ML sont plus complexes et moins d’entre eux devraient être nécessaires.

Un autre domaine d'intérêt dans le développement de cartes de pointage traditionnelles est le processus de passage d'un classement fin à un classement grossier. Le modélisateur cherche ici à diviser efficacement les données continues en plusieurs groupes ordinaux afin que le mauvais taux sous-jacent présente une progression logique et soit basé sur un volume suffisant pour donner un résultat fiable. Les méthodologies avancées au sein des modèles IA/ML éliminent le besoin d'un classement fin à grossier car le regroupement est réalisé par la méthodologie sous-jacente, générant des profils de réponse fluides plutôt que les changements progressifs observés lorsque les limites des attributs du tableau de bord sont franchies. De plus, de nombreuses routines de formation incluent désormais la possibilité d'ajouter des contraintes pour garantir que les fonctionnalités ont un impact logique sur les prédictions du modèle.

Alors que la vague de développement de modèles IA/ML augmentera dans les années à venir, la fusion d’une connaissance approfondie des données de crédit sous-jacentes et d’une méthodologie avancée est essentielle. Alors que de nouveaux défis surgissent dans cette nouvelle génération de modèles, tels que les biais involontaires et l’explicabilité, les préoccupations historiques deviendront moins pertinentes.