NLP, Traitement automatique des langues, IA, à quoi ça sert ?

Découvrez nos dernières études de cas

Trans­for­mer le flux de mes­sages en res­source pédagogique

Je suis direc­teur d’une école qui pro­pose des for­ma­tions en langues étran­gères. Je sou­haite allé­ger la charge de tra­vail des ensei­gnants face au flux conti­nu de ques­tions hors cours. L’ob­jec­tif est de créer un outil simple qui per­mette aux élèves de trou­ver eux-mêmes les réponses à leurs ques­tions à toute heure sans sol­li­ci­ter un professeur.

Repé­rer rapi­de­ment les termes clé d’un document

Je suis res­pon­sable d’un ser­vice public char­gé de l’é­va­lua­tion envi­ron­ne­men­tale des pro­jets sur le ter­ri­toire fran­çais. Mon équipe doit ana­ly­ser des dos­siers d’é­tude d’im­pact consti­tués de lourds fichiers PDF. J’ai­me­rais trou­ver une manière de mettre en évi­dence rapi­de­ment les infor­ma­tions clé des dossiers.

Cibler et consul­ter des don­nées bio­phar­ma­ceu­tiques dans des fichiers volu­mi­neux pour le contrôle qualité 

Je suis res­pon­sable pro­duit au sein d’une entre­prise bio­phar­ma­ceu­tique spé­cia­li­sée dans le déve­lop­pe­ment d’une solu­tion de désen­si­bi­li­sa­tion à cer­tains aller­gènes. Depuis la phase de recherche jus­qu’à la com­mer­cia­li­sa­tion du pro­duit, plu­sieurs mil­liers de docu­ments ont été géné­rés. Cer­tains de ces docu­ments sont régu­liè­re­ment consul­tés par nos équipes de contrôle qua­li­té, mais la taille consé­quente des fichiers com­plexi­fie la recherche ciblée d’in­for­ma­tions à repor­ter. Ce délai ralen­ti notre pro­ces­sus de contrôle qua­li­té. Est-il pos­sible de mettre en place un outil capable d’ex­traire les don­nées numé­riques et tex­tuelles qui per­mette la relec­ture assis­tée de textes pharmaceutiques ?

Questions / Réponses

Recon­nais­sance auto­ma­tique de la parole
La recon­nais­sance auto­ma­tique de la parole (Auto­ma­tic Speech Recog­ni­tion ou ASR en anglais) consiste à trans­for­mer la parole humaine en un texte, en recon­nais­sant les…
Qu’est-ce qu’un crawler ?
Un craw­ler, ou scra­per, est un outil qui per­met d’ob­te­nir le conte­nu (géné­ra­le­ment tex­tuel) d’une page web afin d’ap­pli­quer des trai­te­ments d’analyse. On se place…
Com­ment com­pa­rer des documents ?
Com­pa­rai­son de docu­ments, de quoi parle-t-on ? De nom­breuses appli­ca­tions néces­sitent de pou­voir com­pa­rer des docu­ments entre eux, par exemple pour cor­ri­ger un docu­ment, détec­ter du…
Le résu­mé auto­ma­tique, com­ment ça marche ?
Qu’est-ce qu’un résu­mé de texte auto­ma­tique ? Le résu­mé auto­ma­tique consiste à ana­ly­ser un ou plu­sieurs docu­ments et pro­duire un nou­veau docu­ment plus court qui permet…
Taxi­no­mies : clas­ser des termes et des concepts en NLP
La taxi­no­mie (ou taxo­no­mie selon l’u­sage le plus répan­du, mais décon­seillé par l’Académie des Sciences) est un modèle de repré­sen­ta­tion du lan­gage très utile en traitement…
Ana­lyse sémantique
Signi­fiant, signi­fié, de quoi parle-t-on ? Au tout début du XXème siècle, Louis Fer­di­nand de Saus­sure, dans ses Cours de lin­guis­tique Géné­rale, explo­rait la dif­fé­rence entre…
Caté­go­ri­sa­tion de documents
Pour­quoi caté­go­ri­ser des docu­ments ? L’ac­tion de regrou­per les objets en classes est au moins aus­si ancienne que le lan­gage lui-même, et, d’une cer­taine façon, en…
Qu’est-ce que le clustering ?
Le Clus­te­ring s’ap­plique à un ensemble de docu­ments (un « cor­pus ») et consiste à regrou­per les docu­ments qui se res­semblent. On forme ain­si des sous-ensembles, ou…
Qu’est-ce que la nor­ma­li­sa­tion de textes ?
Quand est-il néces­saire de nor­ma­li­ser des textes ? La nor­ma­li­sa­tion de textes consiste à pré­pa­rer les textes pour effec­tuer un trai­te­ment auto­ma­tique du conte­nu de plus…
Qu’est-ce que la fouille de texte ?
Fouille de texte ou text mining? Le trai­te­ment auto­ma­tique des langues est une étape préa­lable au trai­te­ment infor­ma­tique dans de nom­breuses appli­ca­tions. On consi­dère que…
Extrac­tion d’in­for­ma­tion, de quoi s’agit-il ?
L’extraction d’information, à quoi ça sert ? L’ex­trac­tion d’in­for­ma­tion consiste à iden­ti­fier, dans des textes en langue natu­relle, des infor­ma­tions types : noms de per­sonnes ou de…
Dia­lo­gueurs / Agents conver­sa­tion­nels, de quoi parle-t-on ?
Qu’est-ce qu’un agent conver­sa­tion­nel ? Un agent conver­sa­tion­nel – ou chat­bot en anglais – inter­agit en langue natu­relle, à l’o­ral ou à l’é­crit, avec l’u­ti­li­sa­teur afin…
Com­ment un ordi­na­teur peut-il aider à traduire ?
De quand date la tra­duc­tion auto­ma­tique ? Les pre­mières solu­tions de tra­duc­tion auto­ma­tique et de tra­duc­tion assis­tée par ordi­na­teur sont appa­rues dès le milieu du XXème…
Com­ment fonc­tionne la syn­thèse vocale ?
Syn­thèse de la parole, syn­thèse vocale, Text to Speech, TTS, de quoi parle-t-on ? Syn­thèse de la parole, syn­thèse vocale, Text to Speech, TTS, tous ces…
Sur quels prin­cipes fonc­tionne un module de recherche textuelle ?
Moteur de recherche grand public, moteur de recherche pro­fes­sion­nel, quelles dif­fé­rences ? Les moteurs de recherche du Web sont deve­nus des outils du quo­ti­dien, et ces…
Qu’est-ce qu’une ontologie ?
Une onto­lo­gie est un mode de repré­sen­ta­tion for­melle des connais­sances défi­ni dans le cadre du Web Séman­tique. Vous trou­ve­rez plus d’in­for­ma­tion dans notre fiche Qu’est-ce…
Com­ment fonc­tionne la géné­ra­tion de texte ?
Que signi­fie le sigle NLG ? NLG est l’a­cro­nyme anglais de « Natu­ral Lan­guage Gene­ra­tion », en d’autres termes géné­ra­tion (de textes) en lan­gage natu­rel. Il s’a­git de faire…
Recon­nais­sance Optique de Carac­tères : quelle dif­fé­rence entre l’O­CR et l’ICR ?
La recon­nais­sance optique de carac­tères (ou OCR) consiste à ana­ly­ser un docu­ment dis­po­nible sous forme d’i­mage, par exemple un docu­ment numé­ri­sé au moyen d’un scanner…
Un ordi­na­teur peut-il ana­ly­ser les émotions ?
Le lan­gage humain est com­plexe. Apprendre à un ordi­na­teur ou à une machine com­ment ana­ly­ser les nuances, que ce soit au niveau gram­ma­ti­cal ou culturel,…