Optimiser le travail de modération de mes médias sociaux

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Modérer mes médias sociaux : peut-on alléger et fiabiliser la tâche ?

L'ouverture de nos blogs ou de nos pages sur les réseaux sociaux aux commentaires du public est une opportunité mais aussi un défi. Régulièrement, les contributions des internautes apportent leur lot de propos illicites ou simplement non conformes à notre charte. La modération des commentaires par les équipes de ma publication en ligne est essentielle, mais constitue une responsabilité légale ainsi qu'une charge coûteuse, pour un résultat incertain.

Modérer les commentaires sur mes médias en ligne : une responsabilité légale et un impératif d'image

Modérer les réseaux sociaux, une obligation légale

Supprimer les propos haineux, diffamatoires, discriminatoires est une obligation légale remontant à 1881 et renforcée par plusieurs lois récentes contre la haine en ligne, le cyberharcèlement et les raids numériques.

Un impératif de qualité

Modérer les contributions simplement discourtoises ou inopportunes (spamming) est une nécessité pour maintenir la qualité attendue par mon audience, l'image de ma publication et son attractivité pour les annonceurs.

La modération des commentaires sur les réseaux sociaux : une charge excessive pour la viabilité financière des publications

Assurer la modération constante de mes médias sociaux doit répondre à une double contrainte : le volume de contributions quotidiennes à examiner et la nécessité de réagir rapidement pour prévenir le risque de crises graves.

De fait, les contributions des lecteurs ne s'arrêtent pas aux heures légales de travail ; la modération suppose une mobilisation constante des ressources.

L'IA multilingue permet-elle d'automatiser ou au moins d'assister la modération ? Voire de la fiabiliser ?

La solution

L'intelligence artificielle pour aider les modérateurs à maintenir la conformité légale et garantir le niveau de qualité

Les technologies du traitement automatique du langage pour analyser en continu les contributions et les commentaires

Concevoir et développer l'algorithme les règles de modération

Les modérateurs assurent le contrôle des commentaires et des avis en se fondant à la fois sur des textes juridiques, sur la charte de modération interne, ainsi que sur leur connaissance du domaine traité, qui est leur valeur ajoutée. Une grande majorité des commentaires non conformes est identifiable sur des critères simples ; le repérage de ces messages consomme sans grande valeur ajoutée un temps important des modérateurs. Intégrer ces critères dans des algorithmes d'analyse permet au modérateur de concentrer son effort sur les cas plus subtils.

Selon les besoins propres à la publication, on peut prévoir d'intégrer à l'algorithme une classification des contraventions à la charte de contribution, afin d'orienter utilement le traitement de modération, par exemple :

  • Risque légal :
    • propos discriminatoires ;
    • incitation à la haine, à la violence, harcèlement en ligne ;
    • diffamation ;
    • propagation de fake news.
  • Risque qualité :
    • grossièreté ;
    • "trolling", propos discourtois ;
    • spamming, arnaques.

Comme tout système fondé sur une base de connaissances, une solution d'aide à la modération nécessite une fonction de création, de maintenance et d'enrichissement de la base de connaissances, afin de suivre les évolutions des sujets sensibles et d'introduire une amélioration continue de la détection automatique des propos contrevenant à la charte de publication.

L' apprentissage peut être effectué de trois manières :

  • apprentissage par règles : des linguistes, en collaboration avec les modérateurs, décrivent explicitement les règles de vocabulaire ou de syntaxe permettant d'identifier les commentaires douteux ou à proscrire,
  • apprentissage par l'exemple : des commentaires identifiés comme acceptables, douteux ou à proscrire sont fournis comme exemples à des algorithmes d'apprentissage automatique, dans un corpus déjà annoté et validé.
  • approche hybride entre ces deux méthodes.

Analyser automatiquement tous les contenus

Après une phase d'apprentissage initial, la solution peut être intégrée dans un processus complet de modération, dont la première étape consiste à analyser automatiquement le texte des contributions pour détecter les propos non conformes à la charte de la publication.

Les commentaires relevant d'une libre expression du grand public, l'analyse automatique doit être capable d'interpréter du texte peu académique, incluant des fautes de frappe, de grammaire, une syntaxe défaillante, l'emploi d'émoticônes.

L'analyse peut prévoir une étape préalable de normalisation de texte afin que l'algorithme opère sur un contenu redressé.

Étiqueter les propos indésirables ou douteux

Grâce à l'analyse linguistique, la solution d'aide à modération détecte des expressions susceptibles de contrevenir à la charte des contributions, sur la base de connaissances embarquées par le système : il peut s'agir de règles linguistiques, d'approches fondées sur l'apprentissage, ou encore d'une coopération des deux méthodes.

Outre la simple détection de possibles violations de la charte de contribution, la solution peut prévoir de qualifier leur nature selon une classification établie au préalable, par exemple : propos haineux, appel à la violence, discrimination, grossièretés, spamming. Là encore, la qualification peut procéder par règles linguistiques, par une approche plus statistiques (algorithmes de clustering) ou par une coopération de ces deux méthodes.

Le système peut aussi restituer en sortie de ses traitements un score de fiabilité de la détection de propos non conformes. Ce score permet au modérateur de se concentrer sur les cas plus délicats à interpréter, voire de mettre en place des automatismes (rejet automatique au dessus d'un certain score, validation automatique en deçà d'un autre). Ces stratégies automatiques, si elles sont mises en œuvre, doivent être périodiquement ré-évaluées.

A l'issue de l'étiquetage, les modérateurs sont alertés de toutes les possibles entorses à la charte de contribution détectées dans les commentaires. Ils peuvent alors les passer en revue rapidement pour décider de leur acceptabilité et prendre les mesures nécessaires le cas échéant.

Dans le cas d'une modération a posteriori, l'aide apportée par la détection automatisée peut venir ajouter son flux d'alertes aux signalements laissés par des internautes de propos qu'ils jugent choquants. Le croisement des deux sources apporte au modérateur un renforcement quant au caractère irrecevable de certains commentaires.

Maintenir et enrichir les connaissances nécessaires au repérage des propos indésirables

La maintenance et l'amélioration continue de la reconnaissance de contributions à modérer est d'autant plus nécessaire que les auteurs des propos ciblés mettent souvent en place des stratégies d'évitement lexical de la modération. Ou simplement parce que le vocabulaire des propos haineux, fortement lié aux phénomènes sociologiques, évolue vite et intègre rapidement des néologismes, des anglicismes ou un argot identitaire.

Lorsque la reconnaissance automatique d'expressions non conformes s'appuie sur une approche par règles linguistiques, un module de gestion de ces règles permet leur mise à jour et leur amélioration continue.

Lorsque la solution d'aide à la modération s'appuie sur une approche par apprentissage pour la reconnaissance des propos contraires à la charte de publication, il peut être très intéressant d'utiliser la décision finale du modérateur pour perfectionner l'apprentissage, dans un cycle d'amélioration continue. La maintenance de la solution s'en trouvera grandement facilitée.

 

Points d'attention

Pour repérer efficacement les commentaires nécessitant un examen des modérateurs, il est essentiel de décrire de manière complète les critères de modération en fonction de la charte de l'entreprise.

On l'a vu plus haut, la première étape de mise en œuvre réside dans l'acquisition par la solution automatisée des connaissances nécessaires à la détection de propos non-conformes. Avant de les implémenter, les règles de modération doivent être explicites et partagées par l'organisation.

Pour le succès du projet, cette étape essentielle doit être conduite avec soin. Elle requiert une étroite collaboration des responsables internes de la modération et des experts linguistes afin d'assurer la bonne prise en compte de la charte de modération.

Par Christine Reynaud
Chef de projet contenus numériques

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Optimiser le travail de modération de mes médias sociaux
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Qu'est-ce qu'un gestionnaire de taxinomies ?
A quoi sert une taxinomie ? De nom­breuses appli­ca­tions, notam­ment des appli­ca­tions de trai­te­ment auto­ma­tique des langues, néces­sitent d’u­ti­li­ser un réfé­ren­tiel. Par exemple une nomen­cla­ture des...
Analyse sémantique
Signifiant, signifié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre...
Catégorisation de documents
Pourquoi catégoriser des documents ? L’ac­tion de regrou­per les objets en classes est au moins aus­si ancienne que le lan­gage lui-même, et, d’une cer­taine façon, en...
Qu'est-ce qu'une ontologie ?
Une onto­lo­gie est un mode de repré­sen­ta­tion for­melle des connais­sances défi­ni dans le cadre du Web Séman­tique. Vous trou­ve­rez plus d’in­for­ma­tion dans notre fiche Qu’est-ce...
Un ordinateur peut-il analyser les émotions ?
Le lan­gage humain est com­plexe. Apprendre à un ordi­na­teur ou à une machine com­ment ana­ly­ser les nuances, que ce soit au niveau gram­ma­ti­cal ou cultu­rel,...

Ces études de cas peuvent aussi vous intéresser

Aide à la saisie de comptes rendus d'intervention de maintenance

Responsable du service après-vente (SAV) dans une entreprise de fabrication et d’installation de volets roulants, j'envoie quotidiennement des techniciens de maintenance intervenir chez nos clients. Après chaque intervention, ils doivent rédiger un compte rendu (CR) dont une grande partie est pré-remplie à l’aide de notre logiciel de gestion de maintenance assistée par ordinateur (GMAO). Il reste cependant une zone de texte libre à renseigner, quel que soit le type d’intervention (corrective, préventive ou curative). Le clavier des tablettes et téléphones qu’utilisent nos techniciens ne permet pas de le faire rapidement. La reconnaissance vocale peut-elle faciliter la tâche de nos techniciens lors de rédaction de leurs CR, tout en s'intégrant aisément à notre application de GMAO ?

Classer la polarité des avis clients de manière fine

Je suis responsable du service après-vente d'un site de vente en ligne et nous avons actuellement un système de prédiction automatique permettant de classer les avis de clients comme positifs, négatifs et neutres. Cependant, nous aimerions un système de détection qui, au lieu de donner une étiquette globale à un texte entier, fournisse des informations à un niveau plus fin. Existe-t-il des solutions de ce genre ?

Qualifier automatiquement les leads : un gain de temps et de précision

Je suis responsable commercial du service de ventes en ligne pour une entreprise de vente de produits sportifs, et dans le cadre du processus de gestion de nos leads, je souhaite disposer d'une solution pour aider les commerciaux de mon équipe à qualifier automatiquement les leads et à les classer en fonction de leur profil ou de leurs intentions d'achat.