Automatiser la rédaction de dossiers de crédit aux entreprises
|
|
Le besoin
Création automatique des dossiers de crédit d'entreprise
Constituer un dossier de crédit d'entreprise est chronophage. Cela demande de rassembler des informations venant de différentes sources. Mais la présentation de ces dossiers reste assez homogène d'un projet à un autre : il faut évaluer la capacité financière, les garanties, fournir une description du projet à financer (la structure de l'entreprise, de son chiffre d'affaires, etc.). Le conseiller bancaire chargé de l'évaluation des dossiers doit rassembler des données chiffrées pour constituer un dossier de crédit.
Disposer de dossiers complets, homogènes et clairs permettra non seulement de gagner du temps, mais également de diminuer le risque et d'optimiser la relation client. J'attends de la standardisation automatique des dossiers de crédit à la fois un gain de temps et de productivité mais une plus grande qualité des dossiers.
La solution
Génération automatique de texte (NLG) dans le secteur bancaire
Une première étape : analyse des entrées et des sorties attendues
Tout projet de mise en place d'une solution de rédaction automatique (Natural Language Generation ou NLG en anglais) passe par une première étape d'analyse des entrées et des sorties attendues.
Les entrées d'une solution de NLG
Souvent les données structurées pré-existantes sont "préparées" en amont par le chargé d'affaires de la banque. De façon semblable, une solution de rédaction automatique nécessite de disposer de données structurées, définies selon des modèles de données connus. Cependant, dans certains cas, les information nécessaires ne sont pas directement disponibles sous forme structurée, et peuvent être présentes dans des textes qui ne sont pas directement exploitables par la machine.
Les sections des rapports à produire qui détaillent les données comme la description de la structure de l'entreprise, son chiffre d'affaires ou sa santé financière, etc. sont donc automatisables. Pour ce faire, il faudra d'abord extraire des informations concernant la partie descriptive de l'entreprise. Les technologies de fouille de texte ou d'extraction d'information sont dans ce cas nécessaires pour extraire, identifier et préparer les données.
La sortie d'une solution de NLG : identifier les sections automatisables pour le dossier de crédit
Un dossier de crédit d'entreprise comprend différentes sections, dont un certain nombre sont la traduction presque directe de données structurées en langue naturelle. Il s'agit, pendant cette première phase d'analyse, d'identifier les sections qui sont automatisables et qui peuvent être générées directement par une solution de rédaction automatique.
Typiquement, les sections automatisables sont celles qui concernent les bilans des entreprises, les éléments chiffrés du projet et les modalités de financement. La nature de l'entreprise, son secteur d'activité, ou les éléments d'analyse qualitative seront rédigés par le chargé d'affaire.
L'objectif est de décharger l'analyste des tâches descriptives dans la rédaction du rapport, afin qu'il puisse passer plus de temps sur l'analyse des données. L'ensemble du rapport reste évidemment sous son contrôle.
Quelles techniques pour la génération de texte
La génération de texte peut faire appel à différentes techniques reposant sur des modèles de textes paramétrables ou sur des réseaux de neurones. Pour la génération de textes à partir de données structurées, on fait appel à des techniques dites "data-to-text" qui convertissent les éléments importants d'une table de données en un texte en langue naturelle. Il est donc nécessaire, pour effectuer une génération de texte correspondant à la structure du dossier, d'une part d'identifier ces éléments saillants, pour, ensuite, les convertir en texte.
La connaissance métier est ainsi primordiale pour le système qui doit sélectionner les données importantes, voire alerter le risk manager sur les singularités alors que les données triviales n'ont pas besoin d'être explicitées et peuvent rester uniquement dans les tableaux de chiffres, fréquemment présentés en annexe.
Gains de productivité
Les gains de productivité dépendent bien sur du volume et de la proportion de texte dont la rédaction est automatisable, mais surtout de la qualité des données disponibles et donc de la qualité des textes générés afin de diminuer une post édition trop importante de la part du conseiller bancaire.
Points d'attention
Single point of access : un accès unique à toutes les données
Chaque dossier de crédit est un nouveau projet qui contient des éléments plus ou moins ressemblants, le processus de standardisation automatique permet d'avoir une méthode de traitement similaire des données à partir de bases différentes. Les données nécessaires à la génération ont des natures différentes et sont donc contenues dans des bases de données différentes. Un travail préalable à la mise en place d'une solution devra alors consister à mettre en place des points d'accès à ces différentes sources par exemple en développant des connecteurs.