Veiller à la conformité des petites annonces

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Laisser passer une petite annonce illégale : une hantise pour les directions de publication

Conformité des petites annonces : une obligation légale

Les motifs de non-conformité légale des petites annonces sont légion :

    • Ventes interdites : armes, espèces protégées, ivoire, trafic de faux papiers, etc.
    • Annonces d'emploi ou de logement discriminatoires
    • Vente d'animaux sauvage, vente de chiens catégorisés, annonces de cession d'animaux de compagnie ne comportant pas les mentions obligatoires
    • Risques liés aux données personnelles (vente de contenus à caractère personnel de tiers)

Aux yeux de la loi, le responsable n'est pas uniquement l'auteur de l'annonce, mais également la direction de la publication qui la diffuse.

Une exigence éthique

Outre la contrainte légale, les petites annonces publiées dans mes titres doivent satisfaire un minimum d'exigences éthiques : si elles ne tombent pas sous le coup de la loi, certaines annonces peuvent heurter les lecteurs et nuire à l'image de ma publication.

Enfin, l'équipe éditoriale peut légitimement avoir ses "clauses de conscience" plus exclusives que la loi.

Le problème : le volume d'annonces et les délais de publication

Sur la masse énorme et sans cesse mouvante des annonces publiées chaque semaine, voire chaque jour, comment assurer une surveillance constante et complète...

  • à un coût viable,
  • dans des délais ne pénalisant pas l'offre de petites annonces ?

Y a-t-il un moyen automatique fiable de repérer exhaustivement les annonces non-conformes, ou au moins d'aider les opérateurs humains par un premier niveau d'analyse automatique ?

La solution

Passer les petites annonces au crible du Traitement Automatique des Langues

La solution à mettre en œuvre repose essentiellement sur des fonctions d'analyse de texte, d'annotation, adossées à une base de connaissance des cas de non-conformité.

Petites annonces : une analyse textuelle assez spécialisée

L'enjeu de l'analyse est ici avant tout de reconnaître des séquences avec d'éventuelles variantes (patterns) figurant dans une base de connaissances.

La difficulté ici tient à la spécificité du langage des petites annonces, qui nécessite impérativement d'adapter l'analyseur : abréviations, syntaxe particulière. Il peut être nécessaire de normaliser les textes avant de les soumettre aux traitements linguistiques.

Une base de connaissances pointue et mise à jour

La connaissance des expressions suspectes est fondamentale dans la détection des cas de non-conformité des petites annonces.

Ces connaissances comportent bien sûr des mots ou expressions, mais aussi des séquences plus complexes (phraséologie) car il convient de repérer le plus largement possible les annonces non-conformes, sous une expression d'autant plus variée que les contrevenants délibérés cherchent à contourner une détection sommaire.

Seules les expressions nécessitant un examen seront marquées comme suspectes, mais pour pouvoir repérer ce qui est suspect, encore faut-il pouvoir reconnaître ce qui ne l'est pas.  La base de connaissances doit donc inclure la terminologie spécifique aux petites annonces des diverses rubriques, les abréviations courantes, des  entités nommées telles que des noms de lieux, par exemple, dans  les annonces immobilières.

Compte tenu de la diversité et de l'évolution constante du vocabulaire que l'on peut rencontrer dans les petites annonces, s'agissant notamment d'objets technologiques, la reconnaissance de ces formes peut admettre de légères variantes selon un schéma prédéfini (pattern), afin de ne pas avoir par exemple à enregistrer toutes les versions d'un modèle de console de jeux dans la base de connaissances.

La base de connaissances gagne à être organisée de manière hiérarchique, de manière à classer les formes suspectes des annonces selon des catégories (par exemple : vente illicite, discrimination, absence de mentions obligatoires) : le travail de supervision par un opérateur humain se trouvera ainsi facilité.

Une annotation des annonces suspectes de non-conformité

La fonction essentielle de la solution est de reconnaître des séquences de texte suspectes, sous leurs variantes les plus diverses, en les confrontant aux schémas d'expressions (patterns) enregistrés dans  de la base de connaissance. Il s'agit en fait d'une fonction d'annotation. Chaque séquence suspecte identifiée est alors marquée (soulignement, crochets ou tout autre moyen graphique) et se voit associer une étiquette.

Les formulations à risque peuvent être classées selon une typologie personnalisée, afin de préparer le travail de modérateurs humains.

La solution s'insère généralement dans un worklflow incluant :

  • l'orientation et/ou la priorisation des traitements selon la typologie de la non-conformité suspectée,
  • des alertes aux collaborateurs chargés de superviser les annonces.

L'opérateur humain demeure indispensable pour confirmer la non-conformité, d'autant plus que la solution doit être conçue pour détecter les suspicions de manière large, compte tenu des obligations légales.

Points d'attention

Prendre en compte l'exigence de mise à jour de la base de connaissances

Dans le contexte de la conformité des petites annonces, la base de connaissances linguistiques nécessite une mise à jour continue :

  • afin de suivre l'évolution des offres réelles dans les annonces : jeux vidéo, modèles de téléphones portables, modèles de véhicules...
  • afin de déjouer les stratagèmes évolutifs des contrevenants pour échapper à une surveillance automatique (ex. insertion de signes de ponctuation à l'intérieur d'un mot, expressions détournées)

Ce travail peut lui-même être assisté par une fonction d'extraction de connaissances, destinée à  repérer des séquences nouvellement apparues et leur affecter une typologie prédictive (détection d'entités nommées). Il s'agit par exemple de repérer une forme textuelle qui, par sa structure, a une forte probabilité de correspondre à un modèle de jeu vidéo.

Par Christine Reynaud
Chef de projet contenus numériques

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Veiller à la conformité des petites annonces
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
Leader des technologies d'investigation et services pour la sécurité globale.
 
Agir chaque jour dans votre intérêt, et celui de la société.
 
Lingua Custodia est une Fintech leader du Traitement Automatique des Langues (TAL) pour la Finance basée en France et au Luxembourg. Elle a développé son expertise avec une offre pointue de traduction automatique spécialisée par type de document financier. La société propose aujourd'hui également des services de transcription automatique, des services d'analyse linguistique de document et des services d'extraction de données via sa plateforme en ligne ou par API. Ses clients sont des institutions financières et les départements financiers de grandes sociétés et ETI.
 
Callity est né en 2018 du constat que les solutions de Quality Monitoring et de Speech Analytics traditionnelles étaient dépassées. Qui peut dire aujourd’hui qu’il exploite pleinement l’ensemble de ses interactions clients ? Personne ! Chez Callity nous oeuvrons pour changer cela via une plateforme SaaS moderne, utilisant pleinement les possibilités offertes par l'intelligence artificielle, qui permette aux marques d'exploiter 100% des conversations clients et les transformer en stratégies d'acquisition, de fidélisation et de formation efficaces.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
Automatisation de la relation client via des interfaces conversationnelles et des chatbots. Clustaar permet aux marques d'aider leurs clients en répondant automatiquement à des demandes d'informations ou de support.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Analyse sémantique
Signifiant, signifié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre...
Catégorisation de documents
Pourquoi catégoriser des documents ? L’ac­tion de regrou­per les objets en classes est au moins aus­si ancienne que le lan­gage lui-même, et, d’une cer­taine façon, en...
Extraction d'information, de quoi s'agit-il ?
L’extraction d’information, à quoi ça sert ? L’ex­trac­tion d’in­for­ma­tion consiste à iden­ti­fier, dans des textes en langue natu­relle, des infor­ma­tions types : noms de per­sonnes ou de...

Ces études de cas peuvent aussi vous intéresser

Mettre en place une veille scientifique multilingue

Je suis responsable produits/R&D dans le domaine pharmaceutique, et je souhaite mettre en place une veille multilingue.

Tendances selfcare et modernisation du support client

Je suis directeur du support client chez un fournisseur de télévision par satellite. J’ai pour objectif de mettre en place plus de selfcare et automatiser mon support pour que mes clients trouvent plus rapidement les informations qu’ils recherchent. En parallèle, je dois faire baisser les coûts du support client. Alors, comment faire ?

Comment recommander du contenu qui sera le plus à même d’intéresser le lecteur suite à l’article qu’il vient de consulter ?

Je suis directeur webmarketing pour un éditeur d'informations d'actualité en ligne et je souhaite utiliser un système de recommandation d’articles efficace pour diminuer le taux de rebond des visiteurs du site et les fidéliser.