Argumenter au lieu de bloquer : modérer des contenus en ligne tout en promouvant le débat

Le besoin

Modérer les commentaires des abonnés en évitant le blocage de contenus

Je suis chef de produit d'un quotidien d'actualités.

Pour promouvoir les discussions entre les abonnés de la version en ligne de notre quotidien, nous avons décidé de mettre en place une section de discussion en bas de chaque article.

Ayant déjà recruté des modérateurs de commentaires à cet effet, nous voulons aujourd'hui, au lieu de bloquer les commentaires douteux, appliquer une méthode qui consiste à générer automatiquement des contre-arguments à un commentaire contenant de fausses informations ou un raisonnement douteux. L'avantage d'une telle méthode sera double :

Par rapport au blocage, cette méthode compromet moins la liberté d'expression, principe cher à la démocratie.
La génération automatique de contre-arguments fournit une base de discussion susceptible d'augmenter le taux de participation de nos abonnés dans la section de discussion.

Je cherche donc des outils permettant, lorsque la situation le permet, de fournir automatiquement ou semi-automatiquement des contre-arguments aux commentaires des abonnés.

La solution

Générer automatiquement des contre-arguments

Modération de commentaires, une tâche délicate

La modération de commentaires, ou plus généralement la modération de contenus en ligne, est une tâche courante et importante pour tout média soucieux de la qualité d'échanges entre ses abonnés. Un commentaire peut faire l'objet d'une mesure de modération car il contient des messages haineux, de fausses informations, ou encore, des raisonnements bancals tels que des raisonnements fallacieux du type « Trump n'est pas milliardaire parce que c'est lui-même qui prétend l'être. ». De nos jours, il existe principalement deux méthodes de modération : blocage et avertissement, toutes deux nécessitant un repérage efficace des commentaires non conformes à la loi ou à la charte de publication interne. La première approche a l'avantage d'endiguer d'emblée la mésinformation/désinformation, tandis que la deuxième approche, en signalant des messages douteux aux lecteurs, représente un compromis entre liberté et contrainte. Toutefois, ces deux solutions présentent deux inconvénients principaux :

Elles sont binaires. Un commentaire contient soit une information douteuse, soit une information exacte. Cependant, des commentaires du type « Cette crème solaire est à déconseiller, car Kim Kardashian l'aime beaucoup. » nécessite un traitement plus nuancé.
Elles sont passives, en ce sens que le feed-back fourni aux lecteurs reste peu informatif.

Malgré ces deux désavantages, il est à noter que le blocage reste nécessaire dans le cas où certains commentaires enfreindraient la loi, ce qui par conséquent implique la responsabilité de l'éditeur.

Contre-argumentation ou débat en tant que moyen de modération

Grâce aux dernières avancées de l'Intelligence Artificielle et notamment dans les domaines de la fouille de texte et de la génération automatique de textes (GAT), de nouvelles solutions commencent à faire surface, telles que la génération de contre-arguments qui se montre particulièrement prometteuse. Les contre-arguments générés automatiquement peuvent soit être insérés directement sur les réseaux sociaux, soit être présentés aux modérateurs qui les utilisent par la suite pour fournir un feed-back plus riche aux lecteurs sur les informations douteuses. La génération automatique de contre-arguments présente de multiples avantages :

Elle préserve mieux la liberté d'expression et le droit à l'information par rapport au blocage.
L'utilisation de la génération de contre-arguments comme procédé de modération constitue un moyen stimulant pour fait réfléchir les lecteurs, contribuant ainsi à former/éveiller l'esprit critique de ces derniers.
L'art du débat remonte aux antiquités et il est toujours autant apprécié aujourd'hui. Introduire un débat sur la base des commentaires permet d'augmenter le taux de participation des membres d'une communauté. L'une des communautés les plus actives sur le site de discussion Reddit s'appelle par exemple Change My View (change mon opinion). Chaque jour, de nombreux internautes postent des prises de position sur des sujets sociétaux, incitant les lecteurs à présenter des contre-arguments. L'ambiance particulièrement animée de cette communauté suggère que l'argumentation peut augmenter le degré d'engagement des internautes.

L'une des techniques les plus médiatisées visant à développer les capacités d'argumentation de la machine est sans doute le Projet Debater d'IBM, initié en 2021. L'objectif principal de ce système est de pouvoir engager un débat avec un être humain (et éventuellement gagner le débat). Quelque peu à l'instar de la fameuse compétition pendant laquelle AlphaGo, programme informatique capable de jouer au jeu de go, a battu plusieurs champions du monde, un événement similaire a été organisé en 2019, confrontant le Projet Debater au champion d'un concours de débats interuniversitaires à l'échelle européenne. Bien que le système d'IBM soit conçu pour mener des débats à l'oral, les principales composantes de ce système restent valables pour la génération automatique de contre-arguments en général. Nous présentons dans ce qui suit les étapes essentielles d'un tel système dans le cadre de la modération des commentaires.

Composantes principales d'une chaîne de génération de contre-arguments

Dans un premier temps, il s'agit de repérer automatiquement des éléments argumentatifs d'un commentaire (fouille d'arguments, argument mining en anglais). Ce type de techniques ont déjà été explorées sur les textes biomédicaux où l'on trouve une abondance de mesures expérimentales qui confirment ou infirment les conclusions scientifiques. Dans le cas des commentaires, l'analyse de la structure argumentative peut recourir à des éléments linguistiques différents car les textes de commentaires présentent souvent une subjectivité accrue (je pense que, il est évident que..., etc.). À l'issue de ce stade, deux éléments principaux sont isolés : affirmation et prémisse (claim et evidence en anglais, voir les exemples ci-dessous pour mieux appréhender ces deux concepts).

Dès lors que l'affirmation et la/les prémisse(s) sont identifiées, trois types de contre-argumentation sont possibles :

On attaque directement l'affirmation. Concrètement, deux cas de figure sont possibles :
- Le premier cas de figure relève de la vérification des faits (fact-checking en anglais). Soit le commentaire « Trump n'est pas milliardaire parce que c'est lui-même qui prétend l'être. ». Pour contrer ce commentaire, il suffit de chercher la réponse à la question « Trump est-il milliardaire ? » dans une base de connaissances, construite souvent à base de corpus de presse ou d'articles de Wikipédia.
- Dans le deuxième cas, l'affirmation de l'auteur n'est pas vérifiable et reflète plutôt une prise de position. Un exemple sera le commentaire « Non. Les droits des femmes sont parfaitement protégés en France car dans certains pays, les femmes n'ont même pas le droit de montrer leur visage. ». Ce genre de situations nécessitent un autre type de base de connaissances, cette fois-ci construite manuellement ou de manière semi-automatique. Le système d'IBM utilise une base de connaissance constituée de triplets « argument ~ contre-arguments ~ exemples d'illustration ».
On attaque la prémisse. Les mêmes techniques du point 1 sont applicables à ce cas de figure, avec la nuance suivante que dans le cas où il y aurait plusieurs prémisses, il convient de classer tout d'abord les prémisses par ordre d'attaquabilité et ensuite d'attaquer les prémisses les plus vulnérables, dans le souci de produire une contre-argumentation concise et efficace.
On attaque le raisonnement reliant l'affirmation et la prémisse. Ce type de contre-arguments est particulièrement difficile à générer car l'algorithme doit être capable de raisonner sur des liens de causalité. Si l'on reprend l'exemple de « Non. Les droits des femmes sont parfaitement protégés en France car dans certains pays, les femmes n'ont même pas le droit de montrer leur visage. ». Un contre-argument possible sera de dire que « Ce n'est pas parce que les droits des femmes sont extrêmement mal protégés dans certains pays que la protection des mêmes droits est parfaite en France. ». Une technique courante pour relever ce défi consiste à classer des paires de phrases : ainsi le commentaire « Trump n'est pas milliardaire, parce que c'est lui-même qui l'a dit. » peut être classé comme un raisonnement fallacieux du type Ad Hominem (attaque personnelle).

Enfin, il est à noter que quelle que soit la stratégie de contre-argumentation, il est impératif d'inclure en aval un module de génération automatique de textes afin de produire un texte argumentatif entier, compréhensible et si possible fluide, au lieu de segments non structurés. Le système d'IBM a utilisé un système à base de règles qui commence par générer un thème général à partir des contre-arguments. Ensuite, des techniques de paraphrase et des modèles de paragraphes ont été utilisés pour produire la contre-argumentation complète. Des solutions plus récentes, en s'appuyant sur des progrès en apprentissage profond, utilisent des modèles de langue génératifs du type GPT afin de produire des contre-arguments plus fluides. Ces modèles ont été entraînés sur des corpus textuels gigantesques et peuvent être ajustés (fine-tunés dans le jargon informatique) afin de produire des textes de grande qualité et de nature très différente tels que CV, lettres de motivation, commentaires, voire poèmes, etc.

Argumenter au lieu de bloquer : modérer des commentaires en ligne tout en promouvant le débat

Le besoin

Modérer les commentaires des abonnés en évitant le blocage de contenus

La solution

Générer automatiquement des contre-arguments

Modération de commentaires, une tâche délicate

Contre-argumentation ou débat en tant que moyen de modération

Composantes principales d'une chaîne de génération de contre-arguments

Points d'attention

Le TAL pour la révision des normes d’écriture de documents techniques

Étude de marché automatisée : une force de travail Multi-Agents pour l’analyse des tendances

Génération de données synthétiques : produire des commentaires de réseaux sociaux pour mieux préparer une campagne marketing grâce à l’ingénierie de prompt