Extraire des réponses à des questions de prospects à partir des avis clients

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Un système de questions-réponses basé sur les commentaires de clients

Répondre rapidement aux questions des prospects est un élément crucial pour convertir ces derniers en clients. À moins de recruter, à grands frais, un grand nombre d'agents humains pour qu'ils puissent travailler à tour de rôle, il est quasiment inenvisageable d'assurer une présence humaine 24 h/24. Cependant, laisser les prospects en attente de réponses, c'est prendre le risque de les voir partir vers des sites concurrents et, à plus long terme, de se voir attribuer l'image d'une entreprise de vente en ligne incapable d'interagir rapidement avec des clients potentiels.

Forts d'une section de commentaires riches d'informations, nous avons besoin d'un système de questions-réponses apte à comprendre les questions des prospects ainsi qu'à proposer des éléments de réponse pertinents basés sur les avis clients.

La solution

Que peut m'apporter le NLP

Informer et guider les prospects de manière automatisée

Il existe plusieurs approches pour répondre automatiquement aux questions de prospects :

  • De manière moins directe, l'analyse de sentiments à base d'aspects (aspect-based sentiment analysis, ABSA en anglais) permet d'orienter les prospects vers des informations plus ciblées : retours sur les docteurs ou l'équipe d'accueil d'un centre dentaire, polarité des commentaires de clients sur la durée de batterie d'une montre électronique, etc.
  • A partir des informations contenues dans le catalogue de produits, il est également possible d'intégrer un chatbot à son site de commerce en ligne via la structuration des informations sous forme d'ontologies.

L'ABSA a l'avantage d'exploiter les avis clients disponibles déjà en masse sur des produits ou entreprises, comme le montre l'écran ci-dessous tiré d'une page sur Google Maps. En cliquant sur les boutons, les utilisateurs peuvent obtenir des renseignements extraits grâce à l'analyse automatique.

L'avantage principal d'un chatbot basé sur des ontologies consiste à répondre aux questions des prospects à l'aide du langage naturel, et ce, sans se limiter à des aspects pré-définis.

Ces deux approches étant complémentaires l'une de l'autre et non satisfaisantes dans le cas où les prospects demandent des informations plus précises, les grands sites de commerce en ligne tels qu'Amazon mettent souvent en place également une section de questions-réponses sous la présentation des produits. Les commerçants et les clients ayant déjà acheté un article peuvent ainsi répondre aux questions des prospects, comme le montre l'écran suivant. Vu que le processus est manuel, le délai de réponse peut souvent varier entre quelques heures et plusieurs jours.

 

Extraction de réponses basée sur les commentaires de clients

Pour raccourcir le temps de délai des réponses et profiter pleinement des commentaires de clients, il existe une troisième approche, appelée système de questions-réponses extractif (extractive question answering en anglais). Cette solution consiste à retrouver les segments de texte les plus pertinents à une question donnée, illustrée à l'aide de l'écran ci-dessous où la réponse à la question "quelle est la première œuvre de Beethoven" est extraite d'une biographie indexée sur Google (extrait optimisé selon la terminologie de Google).

En effet, lorsque les commentaires sont trop nombreux, les prospects peuvent se perdre dans la masse d'information et, par conséquent, quitter le site avant de trouver sa réponse. Un système capable d'extraire les réponses à partir des commentaires est une solution idéale pour pallier ce problème car :

  1. Un tel système trie les commentaires en fonction de sa pertinence, permettant aux prospects de se focaliser rapidement sur les commentaires qui les intéressent.
  2. En plus, le segment de texte le plus informatif est remis en relief, maximisant le gain de temps pour les lecteurs.
  3. Tout le processus est automatisé.

Principales composantes d'un système d'extraction de réponses

3 composantes sont en général nécessaires à la mise en place complète d'un système d'extraction de réponses :

  1. Un sélecteur de passage ou de commentaire en l'occurrence (retriever en anglais) pour sélectionner les textes pertinents à la requête (question de prospect).
  2. Un ordonnanceur de passage, intégré souvent dans le sélecteur, pour ordonner les textes sélectionnés.
  3. Un lecteur de passage (reader en anglais) pour extraire les réponses.

Prenons un exemple concret. Un prospect pose une question sur la qualité des touches d'un clavier, l'étape 1 consistera à sélectionner les commentaires en lien avec les touches, l'étape 2 ordonne les commentaires sélectionnés en fonction de leur pertinence, car il est courant de sélectionner un nombre limité de textes pour ne pas submerger le prospect. Enfin, l'étape 3 identifie le début et la fin de la réponse qui serait contenue dans chaque commentaire.

Le retriever est généralement mis en place grâce à la comparaison du texte de la question avec chaque commentaire. Pour cela, deux familles de méthodes sont possibles :

  • Les méthodes non deep learning basées sur une représentation vectorielle d'un texte du type TF-IDF (voir cette FAQ sur le fonctionnement d'un module de recherche textuelle pour une présentation plus détaillée). Ces méthodes ont l'avantage de consommer moins de ressources computationnelles avec à la clef un temps de traitement relativement court.
  • Les méthodes deep learning basées sur une représentation vectorielle sémantique produite par un modèle de langue pré-entraîné du type BERT, plus gourmandes en termes de puissance de calcul mais qui offrent de meilleures performances notamment dans le cas où le mot-clé de la question n'est pas contenue dans les commentaires. Un autre atout de ces méthodes est sa plus grande robustesse face à des textes contenant des fautes de frappe et des erreurs grammaticales.

Du côté du reader, les meilleures solutions d'aujourd'hui sont basées sur le deep learning, notamment à l'aide de l'apprentissage de transfert (transfer learning).

Dans un premier temps, un modèle de langue pré-entraîné (du type CamemBERT en français) est ajusté sur un jeu de données de questions-réponses couvrant des domaines très variés pour que ce premier acquière des capacités de compréhension globales lui permettant d'extraire des réponses à partir d'un texte. Ensuite, un jeu de données spécifiques, commentaires de clients dans notre cas, est utilisé pour poursuivre l'entraînement du modèle afin qu'il acquière des connaissances spécifiques à un domaine donné (adaptation de domaine, domain adaptation en anglais).

Cette méthode à deux phases répond à une réalité : peu d'entreprises disposent de grandes quantités de données sous forme de questions-réponses annotées dont la création pose de lourdes contraintes budgétaires. Pour cette raison, l'apprentissage de transfert seul est généralement non suffisant et il est plus efficace de prendre un modèle « général » et de l'adapter en fonction de ses besoins.

L'écran ci-dessous montre l'avantage et le fonctionnement d'un modèle ajusté, mais non adapté de CamemBERT sur 3 jeux de données généraux. Il s'agit ici d'une question plutôt difficile car « de mauvaise qualité », qui plus est mal orthographiée, est une notion subjective et un mot-clé absent dans le commentaire (contexte sur l'écran).

Enfin, il tout à fait possible de concevoir des systèmes de questions-réponses multilingues, comme illustrent les deux écrans ci-dessous provenant du modèle XML-Roberta, un modèle de langue pré-entraîné multilingue utilisé par de nombreuses entreprises (il s'agit ici de français et anglais). Notons que bien que la réponse en français reste la même, la confiance du modèle est plus basse par rapport au modèle unilingue ci-dessus (0.223 vs. 0.682).

Points d'attention

La performance d'un système de questions-réponses extractif tient à plusieurs facteurs, dont entre autres la précision du retriever et la capacité compréhensive du reader. Il est de ce fait crucial de veiller au bon fonctionnement de l'ensemble du pipeline afin de bâtir un système réussi. Il est aussi important de noter qu'il est tout à fait possible de combiner les commentaires de clients, les informations contenues dans le catalogue de produits ainsi que des ontologies dont la synergie permettra de maximiser la probabilité de bien répondre aux questions de prospects.

Par Xiaoou Wang
Ingénieur-Chercheur en Traitement automatique des Langues, fondateur de https://aiprototypes.com/.

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Extraire des réponses à des questions de prospects à partir des avis clients
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
Leader des technologies d'investigation et services pour la sécurité globale.
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
Yseop’s Augmented Analyst platform brings natural language generation and other advanced technologies together to offer automation fit for regulated industries.
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Emvista fait gagner du temps à ses clients en repensant le Traitement Automatique du Langage Naturel, la discipline de l’intelligence artificielle consacrée à la compréhension de texte. Ses équipes de chercheurs et d’ingénieurs conçoivent des produits pour aider les humains à faire face à l’afflux d’informations et à les transformer en valeur.
 
Agir chaque jour dans votre intérêt, et celui de la société.
 
Automatisation de la relation client via des interfaces conversationnelles et des chatbots. Clustaar permet aux marques d'aider leurs clients en répondant automatiquement à des demandes d'informations ou de support.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Callity est né en 2018 du constat que les solutions de Quality Monitoring et de Speech Analytics traditionnelles étaient dépassées. Qui peut dire aujourd’hui qu’il exploite pleinement l’ensemble de ses interactions clients ? Personne ! Chez Callity nous oeuvrons pour changer cela via une plateforme SaaS moderne, utilisant pleinement les possibilités offertes par l'intelligence artificielle, qui permette aux marques d'exploiter 100% des conversations clients et les transformer en stratégies d'acquisition, de fidélisation et de formation efficaces.
 
Lingua Custodia est une Fintech leader du Traitement Automatique des Langues (TAL) pour la Finance basée en France et au Luxembourg. Elle a développé son expertise avec une offre pointue de traduction automatique spécialisée par type de document financier. La société propose aujourd'hui également des services de transcription automatique, des services d'analyse linguistique de document et des services d'extraction de données via sa plateforme en ligne ou par API. Ses clients sont des institutions financières et les départements financiers de grandes sociétés et ETI.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Analyse sémantique
Signifiant, signifié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre...
Extraction d'information, de quoi s'agit-il ?
L’extraction d’information, à quoi ça sert ? L’ex­trac­tion d’in­for­ma­tion consiste à iden­ti­fier, dans des textes en langue natu­relle, des infor­ma­tions types : noms de per­sonnes ou de...
Comment fonctionne la génération de texte ?
Que signifie le sigle NLG ? NLG est l’a­cro­nyme anglais de « Natu­ral Lan­guage Gene­ra­tion », en d’autres termes géné­ra­tion (de textes) en lan­gage natu­rel. Il s’a­git de faire...

Ces études de cas peuvent aussi vous intéresser

Mettre en place une veille scientifique multilingue

Je suis responsable produits/R&D dans le domaine pharmaceutique, et je souhaite mettre en place une veille multilingue.

Tendances selfcare et modernisation du support client

Je suis directeur du support client chez un fournisseur de télévision par satellite. J’ai pour objectif de mettre en place plus de selfcare et automatiser mon support pour que mes clients trouvent plus rapidement les informations qu’ils recherchent. En parallèle, je dois faire baisser les coûts du support client. Alors, comment faire ?

Comment recommander du contenu qui sera le plus à même d’intéresser le lecteur suite à l’article qu’il vient de consulter ?

Je suis directeur webmarketing pour un éditeur d'informations d'actualité en ligne et je souhaite utiliser un système de recommandation d’articles efficace pour diminuer le taux de rebond des visiteurs du site et les fidéliser.