Surveiller des réseaux criminels

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Détecter des phénomènes et signaux peu perceptibles pour les opérateurs humains

Mettre en évidence des rôles ou des indices qui doivent alerter

A partir des enregistrements audio/vidéo ou de correspondances textuelles, les opérateurs de mon bureau doivent discerner de nouveaux acteurs au sein d'un réseau, les rôles des divers membres du réseau, des changements qui, même lorsqu'ils ne sont pas explicites, peuvent faire envisager des faits importants ou aider à prédire un risque de passage à l'acte.

Je sais que l'intelligence artificielle permet aujourd'hui de mettre en évidence des signaux peu perceptibles à un opérateur humain dans l'évolution d'un corpus de données textuelles, mais quel est l'état de l'art réel ? Ces technologies peuvent-elles identifier les rôles des membres d'un réseau ? Prédire un passage à l'acte ? Quelle place peut-on leur donner dans un dispositif de surveillance ?

Intégrer rapidement une nouvelle langue rare au dispositif de surveillance

Au gré des évolutions géopolitiques, le dispositif de surveillance doit porter une attention nouvelle à tel ou tel pays, région  du monde, ou groupe étranger sur le territoire national. Mon équipe comprend des spécialistes bilingues, mais un outillage informatique de la surveillance doit lui aussi couvrir toutes les langues de travail des agents. Les technologies d'analyse linguistique capables d'outiller la surveillance des réseaux criminels sont-elles disponibles dans des langues rares telles que l'ourdou, le tchétchène ou le swahili ? A quelles conditions peut-on intégrer une nouvelle langue si besoin ?

La solution

Une palette d'outils de traitement du texte et de la parole

Transcrire la parole en texte pour unifier le corpus de données

Lorsque les sources collectées sont de nature audio, vidéo et textuelles, il peut être préférable de ramener l'ensemble du matériau à du texte, afin d'optimiser l'apprentissage par les systèmes automatisés.

La solution intègre donc classiquement un module de transcription de la parole, qui peut prendre en entrée un flux audio ou vidéo.

Reconnaître des situations dans le flux de données par l'apprentissage automatique

Les technologies de traitement du langage sont aujourd'hui mures pour identifier par apprentissage des "patterns" de situations dans des données textuelles fréquemment actualisées, même si les faits ou les situations ne sont pas explicitement abordés :

  • la hiérarchie d'un réseau et certains rôles typiques de leurs membres,
  • des modifications dans les relations entre les membres ou l'arrivée d'un nouveau membre,
  • l'identité probable comme une seule et même personnes de deux intervenants présentés sous des noms différents,
  • des changements d'activité prédictifs d'un passage à l'acte ou d'un fait majeur au sein du réseau.

Ces analyses reposent sur le repérage de patterns typiques dans le flux des données, c'est à dire des régularités admettant de possibles variantes, qui peuvent porter sur les mots, les expressions, la phraséologie et notamment la manière de s'adresser l'un à l'autre des interlocuteurs. Un historique de données déjà analysées, dont les conclusions ont pu être vérifiées, permet d'alimenter un système d'apprentissage automatique ; dès lors, l'outil peut induire, à partir de nouvelles données, des phénomènes extraits a posteriori de l'historique.

Ces analyses constituent un appoint précieux en complément du travail des agents humains, en mettant en évidence des phénomènes imperceptibles dans la masse.

Intégrer rapidement de nouvelles langues, y compris rares, par l'apprentissage automatique

La localisation d'un logiciel dans une nouvelle langue peut être une opération très lourde lorsqu'elle repose uniquement sur un moteur de règles linguistiques. Fort heureusement, les technologies de machine learning sont mures depuis déjà des années pour réaliser des tâches d'analyse sur une langue nouvelle, dès lors qu'elles disposent d'un corpus de taille suffisante et représentatif des données réelles à analyser. Si la qualité d'analyse peut être éternellement perfectionnée, une production opérationnelle dans une nouvelle langue peut être atteinte en quelques mois.

Points d'attention

Nous l'avons vu précédemment : les technologies linguistiques d'aide à la surveillance des réseaux criminels reposent très fortement sur des systèmes construits par apprentissage. La masse mais également la qualité des données d'apprentissage sont des conditions majeures de succès pour atteindre un apport décisif aux équipes de renseignement.

Ces technologies sont un complément précieux là où l'humain est limité dans ses analyses : elles s'intègrent idéalement dans un processus et un poste de travail adaptés aux modes opératoires des agents humains, aux côtés d'autres technologies assez similaires opérant sur l'image ou autres données non textuelles.

Par Christine Reynaud
Chef de projet contenus numériques

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Surveiller des réseaux criminels
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Reconnaissance automatique de la parole
La recon­nais­sance auto­ma­tique de la parole (Auto­ma­tic Speech Recog­ni­tion ou ASR en anglais) consiste à trans­for­mer la parole humaine en un texte, en recon­nais­sant les...
Analyse sémantique
Signifiant, signifié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre...
Qu'est-ce que la fouille de texte ?
Fouille de texte ou text mining? Le trai­te­ment auto­ma­tique des langues est une étape préa­lable au trai­te­ment infor­ma­tique dans de nom­breuses appli­ca­tions. On consi­dère que...
Extraction d'information, de quoi s'agit-il ?
L’extraction d’information, à quoi ça sert ? L’ex­trac­tion d’in­for­ma­tion consiste à iden­ti­fier, dans des textes en langue natu­relle, des infor­ma­tions types : noms de per­sonnes ou de...
Un ordinateur peut-il analyser les émotions ?
Le lan­gage humain est com­plexe. Apprendre à un ordi­na­teur ou à une machine com­ment ana­ly­ser les nuances, que ce soit au niveau gram­ma­ti­cal ou cultu­rel,...

Ces études de cas peuvent aussi vous intéresser

Classer la polarité des avis clients de manière fine

Je suis responsable du service après-vente d'un site de vente en ligne et nous avons actuellement un système de prédiction automatique permettant de classer les avis de clients comme positifs, négatifs et neutres. Cependant, nous aimerions un système de détection qui, au lieu de donner une étiquette globale à un texte entier, fournisse des informations à un niveau plus fin. Existe-t-il des solutions de ce genre ?

Comment exploiter les données cliniques dans une veille biomédicale ciblée ?

Je suis responsable produit dans l'industrie pharmaceutique et j'aimerais qu'un outil m'aide à exploiter le contenu textuel des essais cliniques, de comptes-rendus, expériences patients, signalements d'effets indésirables dans l'optique d'optimiser la veille de molécules médicamenteuses. Un tel outil peut m'être d'une aide particulièrement précieuse. D'une part, les données disponibles dans le domaine pharmaceutique, de par leur volume et leur diversité, sont difficiles à archiver et analyser à la main, d'autre part, la qualité des articles parus sur les revues médicales est conditionnée par les choix éditoriaux ainsi que d'éventuels conflits d'intérêt. Il me sera donc utile de disposer d'un outil pour que je puisse effectuer, de manière efficace et surtout à partir des sources brutes, une veille ciblée sur un sujet précis.

Quantifier des opinions dans des réponses libres : un défi

Je suis décideur dans un institut d'études marketing et de sondage d'opinion. Je souhaite lancer des enquêtes incluant des questions ouvertes pour leur richesse. Mais comment dépouiller toutes ces contributions en texte libre ?