Comment lutter contre les fake news grâce au fact checking

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Quelle solution de fact checking pour mon ONG ?

Médias sociaux, lobbying et  fake news

A l'heure où plus de la moitié de la population mondiale est présente sur les réseaux sociaux, la Digital Advocacy  et la maîtrise de l'écosystème numérique est devenue un élément essentiel de la stratégie de communication de toute action citoyenne.

En tant responsable communication, j'ai besoin d'identifier les acteurs présents sur mon écosystème digital - industriels, influences, ONG- , de repérer les informations liées à mon secteur d'activité et de connaître l'impact de ma communication.

La solution

Le traitement automatique des langues et l'intelligence artificielle pour le fact checking

Le traitement automatique du langage naturel contribue à la détection de fake news et à la mise en oeuvre de solutions de  fact checking.

Surveiller les réseaux sociaux

Avant d'analyser une information, il faut bien sûr d'abord la repérer. Une solution de fact checking passe par une veille sur les réseaux sociaux et partage des fonctionnalités avec d'autres solutions, comme par exemple la veille d'information. Un crawler est ainsi un  module de Traitement Automatique des Langues qui va scanner les réseaux sociaux et Internet et collecter les informations à examiner.

Un faisceau d'indices pour le fact checking

Les solutions de fact checking mettent en œuvre différentes méthodes pour identifier les fake news. Vérifier une information nécessite d'examiner des indices de diverses natures, qui sont, pour une bonne part, des indices linguistiques. Le traitement de la langue est alors un des moyens utilisés, aux côtés de diverses technologies. Ainsi, on trouvera les fonctions suivantes dans une solution de fact checking :

  • rechercher et comparer des publications similaires

Une fausse information peut être diffusée sous différentes formes, posts de blogs différents, intervention sur les réseaux sociaux, articles... Il est possible qu'une fausse information ait déjà été repérée sous une autre forme. Les modules de comparaisons de documents permettent de vérifier si deux textes sont proches.

  • évaluer la fiabilité d'une source d'information sur Internet

Divers indices linguistiques (vocabulaire utilisé, structure d'un article...) ou métalinguistiques (auteur, images associées...) permettent d'identifier la source d'une information qui peut déjà avoir été identifiée comme diffusant des infox. Un module d'analyse sémantique peut aider à repérer les alertes déjà émises sur ces sources.

Une des stratégies utilisées par les diffuseurs d'infox consiste à publier des textes sous formes d'images et ainsi tenter de contourner les traitements automatisés de fact checking. Des modules de reconnaissance optique de caractères, éventuellement associés à des solutions de traduction automatique permettent de parer ce type de contournements.

Associer différents outils pour une solution globale de fact checking

On le voit, une solution de fact checking se doit d'intégrer des fonctions de traitement du langage à coté d'autres fonctions, telles que des fonctions de comparaison d'images et obtenir ainsi un faisceau d'indices permettant d'évaluer la fiabilité d'une information.

Par Alain Couillault
PhD Chargé de Mission Innovation APIL

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Comment lutter contre les fake news grâce au fact checking
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Qu'est-ce qu'un crawler ?
Un craw­ler, ou scra­per, est un outil qui per­met d’ob­te­nir le conte­nu (géné­ra­le­ment tex­tuel) d’une page web afin d’ap­pli­quer des trai­te­ments d’analyse. On se place...
Comment comparer des documents ?
Comparaison de documents, de quoi parle-t-on ? De nom­breuses appli­ca­tions néces­sitent de pou­voir com­pa­rer des docu­ments entre eux, par exemple pour cor­ri­ger un docu­ment, détec­ter du...
Analyse sémantique
Signifiant, signifié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre...
Catégorisation de documents
Pourquoi catégoriser des documents ? L’ac­tion de regrou­per les objets en classes est au moins aus­si ancienne que le lan­gage lui-même, et, d’une cer­taine façon, en...
Qu'est-ce que la fouille de texte ?
Fouille de texte ou text mining? Le trai­te­ment auto­ma­tique des langues est une étape préa­lable au trai­te­ment infor­ma­tique dans de nom­breuses appli­ca­tions. On consi­dère que...
Comment un ordinateur peut-il aider à traduire ?
De quand date la traduction automatique ? Les pre­mières solu­tions de tra­duc­tion auto­ma­tique et de tra­duc­tion assis­tée par ordi­na­teur sont appa­rues dès le milieu du XXème...
Sur quels principes fonctionne un module de recherche textuelle ?
Moteur de recherche grand public, moteur de recherche professionnel, quelles différences ? Les moteurs de recherche du Web sont deve­nus des outils du quo­ti­dien, et ces...
Reconnaissance Optique de Caractères : quelle différence entre l'OCR et l'ICR ?
La recon­nais­sance optique de carac­tères (ou OCR) consiste à ana­ly­ser un docu­ment dis­po­nible sous forme d’i­mage, par exemple un docu­ment numé­ri­sé au moyen d’un scan­ner...

Ces études de cas peuvent aussi vous intéresser

Classer la polarité des avis clients de manière fine

Je suis responsable du service après-vente d'un site de vente en ligne et nous avons actuellement un système de prédiction automatique permettant de classer les avis de clients comme positifs, négatifs et neutres. Cependant, nous aimerions un système de détection qui, au lieu de donner une étiquette globale à un texte entier, fournisse des informations à un niveau plus fin. Existe-t-il des solutions de ce genre ?

Comment exploiter les données cliniques dans une veille biomédicale ciblée ?

Je suis responsable produit dans l'industrie pharmaceutique et j'aimerais qu'un outil m'aide à exploiter le contenu textuel des essais cliniques, de comptes-rendus, expériences patients, signalements d'effets indésirables dans l'optique d'optimiser la veille de molécules médicamenteuses. Un tel outil peut m'être d'une aide particulièrement précieuse. D'une part, les données disponibles dans le domaine pharmaceutique, de par leur volume et leur diversité, sont difficiles à archiver et analyser à la main, d'autre part, la qualité des articles parus sur les revues médicales est conditionnée par les choix éditoriaux ainsi que d'éventuels conflits d'intérêt. Il me sera donc utile de disposer d'un outil pour que je puisse effectuer, de manière efficace et surtout à partir des sources brutes, une veille ciblée sur un sujet précis.

Détecter des phénomènes et signaux peu perceptibles pour les opérateurs humains

Officier des forces de sécurité, j'anime une cellule de surveillance des réseaux criminels de toutes sortes, notamment à partir des interceptions de relations entre les membres de ces réseaux : texte, mais surtout enregistrements audio, dans les langues les plus diverses, parfois rares. Je sais que l'intelligence artificielle permet de mettre en évidence des faits d'intérêt majeur par l'analyse dans le temps de ces données textuelles et aimerais en savoir davantage.