Optimiser le travail de modération de mes médias sociaux

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Modérer mes médias sociaux : peut-on alléger et fiabiliser la tâche ?

L'ouverture de nos blogs ou de nos pages sur les réseaux sociaux aux commentaires du public est une opportunité mais aussi un défi. Régulièrement, les contributions des internautes apportent leur lot de propos illicites ou simplement non conformes à notre charte. La modération des commentaires par les équipes de ma publication en ligne est essentielle, mais constitue une responsabilité légale ainsi qu'une charge coûteuse, pour un résultat incertain.

Modérer les commentaires sur mes médias en ligne : une responsabilité légale et un impératif d'image

Modérer les réseaux sociaux, une obligation légale

Supprimer les propos haineux, diffamatoires, discriminatoires est une obligation légale remontant à 1881 et renforcée par plusieurs lois récentes contre la haine en ligne, le cyberharcèlement et les raids numériques.

Un impératif de qualité

Modérer les contributions simplement discourtoises ou inopportunes (spamming) est une nécessité pour maintenir la qualité attendue par mon audience, l'image de ma publication et son attractivité pour les annonceurs.

La modération des commentaires sur les réseaux sociaux : une charge excessive pour la viabilité financière des publications

Assurer la modération constante de mes médias sociaux doit répondre à une double contrainte : le volume de contributions quotidiennes à examiner et la nécessité de réagir rapidement pour prévenir le risque de crises graves.

De fait, les contributions des lecteurs ne s'arrêtent pas aux heures légales de travail ; la modération suppose une mobilisation constante des ressources.

L'IA multilingue permet-elle d'automatiser ou au moins d'assister la modération ? Voire de la fiabiliser ?

La solution

L'intelligence artificielle pour aider les modérateurs à maintenir la conformité légale et garantir le niveau de qualité

Les technologies du traitement automatique du langage pour analyser en continu les contributions et les commentaires

Concevoir et développer l'algorithme les règles de modération

Les modérateurs assurent le contrôle des commentaires et des avis en se fondant à la fois sur des textes juridiques, sur la charte de modération interne, ainsi que sur leur connaissance du domaine traité, qui est leur valeur ajoutée. Une grande majorité des commentaires non conformes est identifiable sur des critères simples ; le repérage de ces messages consomme sans grande valeur ajoutée un temps important des modérateurs. Intégrer ces critères dans des algorithmes d'analyse permet au modérateur de concentrer son effort sur les cas plus subtils.

Selon les besoins propres à la publication, on peut prévoir d'intégrer à l'algorithme une classification des contraventions à la charte de contribution, afin d'orienter utilement le traitement de modération, par exemple :

  • Risque légal :
    • propos discriminatoires ;
    • incitation à la haine, à la violence, harcèlement en ligne ;
    • diffamation ;
    • propagation de fake news.
  • Risque qualité :
    • grossièreté ;
    • "trolling", propos discourtois ;
    • spamming, arnaques.

Comme tout système fondé sur une base de connaissances, une solution d'aide à la modération nécessite une fonction de création, de maintenance et d'enrichissement de la base de connaissances, afin de suivre les évolutions des sujets sensibles et d'introduire une amélioration continue de la détection automatique des propos contrevenant à la charte de publication.

L' apprentissage peut être effectué de trois manières :

  • apprentissage par règles : des linguistes, en collaboration avec les modérateurs, décrivent explicitement les règles de vocabulaire ou de syntaxe permettant d'identifier les commentaires douteux ou à proscrire,
  • apprentissage par l'exemple : des commentaires identifiés comme acceptables, douteux ou à proscrire sont fournis comme exemples à des algorithmes d'apprentissage automatique, dans un corpus déjà annoté et validé.
  • approche hybride entre ces deux méthodes.

Analyser automatiquement tous les contenus

Après une phase d'apprentissage initial, la solution peut être intégrée dans un processus complet de modération, dont la première étape consiste à analyser automatiquement le texte des contributions pour détecter les propos non conformes à la charte de la publication.

Les commentaires relevant d'une libre expression du grand public, l'analyse automatique doit être capable d'interpréter du texte peu académique, incluant des fautes de frappe, de grammaire, une syntaxe défaillante, l'emploi d'émoticônes.

L'analyse peut prévoir une étape préalable de normalisation de texte afin que l'algorithme opère sur un contenu redressé.

Étiqueter les propos indésirables ou douteux

Grâce à l'analyse linguistique, la solution d'aide à modération détecte des expressions susceptibles de contrevenir à la charte des contributions, sur la base de connaissances embarquées par le système : il peut s'agir de règles linguistiques, d'approches fondées sur l'apprentissage, ou encore d'une coopération des deux méthodes.

Outre la simple détection de possibles violations de la charte de contribution, la solution peut prévoir de qualifier leur nature selon une classification établie au préalable, par exemple : propos haineux, appel à la violence, discrimination, grossièretés, spamming. Là encore, la qualification peut procéder par règles linguistiques, par une approche plus statistiques (algorithmes de clustering) ou par une coopération de ces deux méthodes.

Le système peut aussi restituer en sortie de ses traitements un score de fiabilité de la détection de propos non conformes. Ce score permet au modérateur de se concentrer sur les cas plus délicats à interpréter, voire de mettre en place des automatismes (rejet automatique au dessus d'un certain score, validation automatique en deçà d'un autre). Ces stratégies automatiques, si elles sont mises en œuvre, doivent être périodiquement ré-évaluées.

A l'issue de l'étiquetage, les modérateurs sont alertés de toutes les possibles entorses à la charte de contribution détectées dans les commentaires. Ils peuvent alors les passer en revue rapidement pour décider de leur acceptabilité et prendre les mesures nécessaires le cas échéant.

Dans le cas d'une modération a posteriori, l'aide apportée par la détection automatisée peut venir ajouter son flux d'alertes aux signalements laissés par des internautes de propos qu'ils jugent choquants. Le croisement des deux sources apporte au modérateur un renforcement quant au caractère irrecevable de certains commentaires.

Maintenir et enrichir les connaissances nécessaires au repérage des propos indésirables

La maintenance et l'amélioration continue de la reconnaissance de contributions à modérer est d'autant plus nécessaire que les auteurs des propos ciblés mettent souvent en place des stratégies d'évitement lexical de la modération. Ou simplement parce que le vocabulaire des propos haineux, fortement lié aux phénomènes sociologiques, évolue vite et intègre rapidement des néologismes, des anglicismes ou un argot identitaire.

Lorsque la reconnaissance automatique d'expressions non conformes s'appuie sur une approche par règles linguistiques, un module de gestion de ces règles permet leur mise à jour et leur amélioration continue.

Lorsque la solution d'aide à la modération s'appuie sur une approche par apprentissage pour la reconnaissance des propos contraires à la charte de publication, il peut être très intéressant d'utiliser la décision finale du modérateur pour perfectionner l'apprentissage, dans un cycle d'amélioration continue. La maintenance de la solution s'en trouvera grandement facilitée.

 

Points d'attention

Pour repérer efficacement les commentaires nécessitant un examen des modérateurs, il est essentiel de décrire de manière complète les critères de modération en fonction de la charte de l'entreprise.

On l'a vu plus haut, la première étape de mise en œuvre réside dans l'acquisition par la solution automatisée des connaissances nécessaires à la détection de propos non-conformes. Avant de les implémenter, les règles de modération doivent être explicites et partagées par l'organisation.

Pour le succès du projet, cette étape essentielle doit être conduite avec soin. Elle requiert une étroite collaboration des responsables internes de la modération et des experts linguistes afin d'assurer la bonne prise en compte de la charte de modération.

Par Christine Reynaud
Chef de projet contenus numériques

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Optimiser le travail de modération de mes médias sociaux
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
Agir chaque jour dans votre intérêt, et celui de la société.
 
Callity est né en 2018 du constat que les solutions de Quality Monitoring et de Speech Analytics traditionnelles étaient dépassées. Qui peut dire aujourd’hui qu’il exploite pleinement l’ensemble de ses interactions clients ? Personne ! Chez Callity nous oeuvrons pour changer cela via une plateforme SaaS moderne, utilisant pleinement les possibilités offertes par l'intelligence artificielle, qui permette aux marques d'exploiter 100% des conversations clients et les transformer en stratégies d'acquisition, de fidélisation et de formation efficaces.
 
Automatisation de la relation client via des interfaces conversationnelles et des chatbots. Clustaar permet aux marques d'aider leurs clients en répondant automatiquement à des demandes d'informations ou de support.
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Lingua Custodia est une Fintech leader du Traitement Automatique des Langues (TAL) pour la Finance basée en France et au Luxembourg. Elle a développé son expertise avec une offre pointue de traduction automatique spécialisée par type de document financier. La société propose aujourd'hui également des services de transcription automatique, des services d'analyse linguistique de document et des services d'extraction de données via sa plateforme en ligne ou par API. Ses clients sont des institutions financières et les départements financiers de grandes sociétés et ETI.
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
Leader des technologies d'investigation et services pour la sécurité globale.
 
Emvista fait gagner du temps à ses clients en repensant le Traitement Automatique du Langage Naturel, la discipline de l’intelligence artificielle consacrée à la compréhension de texte. Ses équipes de chercheurs et d’ingénieurs conçoivent des produits pour aider les humains à faire face à l’afflux d’informations et à les transformer en valeur.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Taxinomies : classer des termes et des concepts en NLP
La taxi­no­mie est un modèle de repré­sen­ta­tion du lan­gage très utile en trai­te­ment auto­ma­tique des langues. Elle per­met de clas­ser et hié­rar­chi­ser des concepts. Les...
Analyse sémantique
Signifiant, signifié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre...
Catégorisation de documents
Pourquoi catégoriser des documents ? L’ac­tion de regrou­per les objets en classes est au moins aus­si ancienne que le lan­gage lui-même, et, d’une cer­taine façon, en...
Qu'est-ce qu'une ontologie ?
Une onto­lo­gie est un mode de repré­sen­ta­tion for­melle des connais­sances défi­ni dans le cadre du Web Séman­tique. Vous trou­ve­rez plus d’in­for­ma­tion dans notre fiche Qu’est-ce...
Un ordinateur peut-il analyser les émotions ?
Le lan­gage humain est com­plexe. Apprendre à un ordi­na­teur ou à une machine com­ment ana­ly­ser les nuances, que ce soit au niveau gram­ma­ti­cal ou cultu­rel,...

Ces études de cas peuvent aussi vous intéresser

Mettre en place une veille scientifique multilingue

Je suis responsable produits/R&D dans le domaine pharmaceutique, et je souhaite mettre en place une veille multilingue.

Tendances selfcare et modernisation du support client

Je suis directeur du support client chez un fournisseur de télévision par satellite. J’ai pour objectif de mettre en place plus de selfcare et automatiser mon support pour que mes clients trouvent plus rapidement les informations qu’ils recherchent. En parallèle, je dois faire baisser les coûts du support client. Alors, comment faire ?

Exploiter efficacement les bases de brevets

En tant que responsable R&D, il est important pour moi d’exploiter les bases de données de brevets dans mon domaine d’activités pour m'assurer que la société ne va pas investir du temps et de l'argent dans un projet qui pourrait être considéré comme une violation de brevet. Cependant, la volumétrie des données disponibles est considérable. A titre d’exemple, l’Office Européen des Brevets donne accès à plus de 140 millions documents de brevets. Le Traitement Automatique des Langues peut-il m’aider à mieux présélectionner des brevets via un fournisseur de brevets et ensuite à en faire un tri efficace ?