Un ordinateur peut-il analyser les émotions ?

Le lan­gage humain est com­plexe. Apprendre à un ordi­na­teur ou à une machine com­ment ana­ly­ser les nuances, que ce soit au niveau gram­ma­ti­cal ou cultu­rel, ain­si que com­ment le contexte peut influen­cer le sens de la phrase, est un pro­ces­sus dif­fi­cile qui n’est pas impossible.

Que signifie l’analyse des sentiments ?

L’a­na­lyse des sen­ti­ments, éga­le­ment appe­lée opi­nion mining ou emo­tion ana­ly­sis en anglais, est un domaine d’é­tude consis­tant à ana­ly­ser les émo­tions, les sen­sa­tions et les atti­tudes des indi­vi­dus vis-à-vis des enti­tés telles que les pro­duits, les ser­vices, etc. Il s’a­git d’un des domaines de recherche les plus actifs en trai­te­ment auto­ma­tique de lan­gage natu­rel depuis le début des années 2000. 

L’a­na­lyse des sen­ti­ments vise à extraire des infor­ma­tions sub­jec­tives telles que des opi­nions et des sen­ti­ments à par­tir de textes éva­lua­tifs en lan­gage natu­rel sur des sites web et des médias sociaux. Elle per­met d’analyser auto­ma­ti­que­ment toutes ces don­nées tex­tuelles, de mieux com­prendre sa per­cep­tion et d’en faire res­sor­tir les dif­fé­rentes opi­nions expri­mées dans une men­tion en ligne, sur un sujet pré­cis comme une marque, une actua­li­té ou un produit.

Types d’analyse des sentiments 

Il y a de nom­breux types d’a­na­lyse des sen­ti­ments qui sont appliqués : 

  • Clas­si­fi­ca­tion des pola­ri­tés : posi­tive, néga­tive ou neutre ;
  • Détec­tion des émo­tions : joyeux, triste, en colère, etc. ;
  • Iden­ti­fi­ca­tion des inten­tions : inté­res­sé, pas inté­res­sé, etc..

Catégories des sentiments ?

Les sen­ti­ments sont géné­ra­le­ment clas­si­fiés en trois pola­ri­tés : posi­tive, néga­tive ou neutre.

Selon les mots et les phrases par­ti­cu­liers qui sont extraits, le texte ou la phrase sera catégorisé(e).

Ain­si, sui­vant le type d’a­na­lyse pré­dé­fi­ni, il est pos­sible d’a­voir des caté­go­ries plus fines, par exemple : 

  • Très posi­tive
  • Posi­tive
  • Neutre
  • Néga­tive
  • Très néga­tive

De ce fait, l’a­na­lyse des sen­ti­ments per­met d’a­na­ly­ser une grande quan­ti­té de don­nées afin de pou­voir faci­le­ment iden­ti­fier les sen­ti­ments associés.

Niveaux d’analyses

De manière géné­rale, il y a trois niveaux d’a­na­lyse des sentiments :

  • Niveau du docu­ment : la pola­ri­té du texte entier sera déter­mi­née. Cela signi­fie que le texte n’ex­prime qu’une seule opi­nion sur un seul concept/produit.
  • Niveau de la phrase : la pola­ri­té de chaque phrase dans le texte sera déter­mi­née. Cela signi­fie que chaque phrase exprime une opi­nion unique sur une enti­té unique. 
  • Niveau des aspects : ce niveau d’a­na­lyse qui est plus fin que les deux pré­cé­dents per­met d’a­na­ly­ser le texte afin d’i­den­ti­fier dif­fé­rents aspects et de déter­mi­ner le sen­ti­ment qui cor­res­pond pour cha­cun.

    Plus concrè­te­ment, pre­nons l’exemple sui­vant :
    « Cet ordi­na­teur est bien, mais il vaut mieux que sa bat­te­rie dure plus long­temps et qu’il soit plus léger à por­ter.« 

    Il y a trois aspects qui sont évalués : 
    • l’or­di­na­teur => positif ;
    • l’au­to­no­mie de la bat­te­rie => négatif ;
    • le poids => négatif.

Analyse des sentiments, comment ça marche ?

Il existe plu­sieurs façons d’analyser les sen­ti­ments, avec de nom­breux méthodes et algo­rithmes pour mettre en œuvre des sys­tèmes d’a­na­lyse des sen­ti­ments comme suit : 

  • Approche par appren­tis­sage auto­ma­tique super­vi­sé : repose sur des tech­niques d’ap­pren­tis­sage auto­ma­tique (Machine Lear­ning). Il s’a­git d’apprendre au sys­tème à clas­ser de façon auto­ma­tique sur la base de sta­tis­tiques, par exemple, un avis client est posi­tif, néga­tif ou neutre (en cas d’a­na­lyse de pola­ri­té).

    Pour que l’apprentissage auto­ma­tique fonc­tionne, il faut anno­ter un jeu de don­nées. Un algo­rithme pro­ba­bi­liste va ensuite ana­ly­ser cette anno­ta­tion afin d’en faire res­sor­tir des règles qui per­met­tront de clas­ser d’autres avis selon les polarités.
  • Approche à base de règles lin­guis­tiques : il s’a­git d’a­na­ly­ser un échan­tillon d’avis pour déter­mi­ner quels sont les mots ou les expres­sions qui indiquent le sen­ti­ment et ses dif­fé­rents degrés. Une fois cette ana­lyse lin­guis­tique effec­tuée, des règles de gram­maire qui seront créées per­met­tront au sys­tème de clas­ser chaque avis dans l’une ou l’autre des polarités. 
  • Approche hybride : cette méthode est assez intui­tive puis­qu’elle com­bine le meilleur des deux approches pré­cé­dentes. En com­bi­nant les deux approches, la pré­ci­sion peut être améliorée.

Les limites de l’analyse des sentiments

Des risques d’er­reur existent tou­jours dans n’im­porte quel pro­cé­dé auto­ma­ti­sé. L’in­ter­ven­tion humaine est sou­vent néces­saire dans ce cas afin d’as­su­rer la per­ti­nence de l’analyse. 

Cer­tains sys­tèmes se contentent de four­nir une tona­li­té glo­bale et de faire une extrac­tion de thème glo­bal, sans affi­ner au niveau des aspects men­tion­nés ci-des­sus. Les résul­tats sont alors moins pertinents.

Au-delà de la fia­bi­li­té, il est indis­pen­sable de prendre en compte que la com­mu­ni­ca­tion humaine ne se limite pas qu’à trois pola­ri­tés, posi­tive, néga­tive et neutre. 

Par Minh Anh Nguyen
Consultante NLP

Études de cas associés

Classer la polarité des avis clients de manière fine

Je suis responsable du service après-vente d'un site de vente en ligne et nous avons actuellement un système de prédiction automatique permettant de classer les avis de clients comme positifs, négatifs et neutres. Cependant, nous aimerions un système de détection qui, au lieu de donner une étiquette globale à un texte entier, fournisse des informations à un niveau plus fin. Existe-t-il des solutions de ce genre ?

Modérer mes médias sociaux : peut-on alléger et fiabiliser la tâche ?

Directeur de publication dans un groupe de presse, je suis responsable de la visibilité de mon journal dans l'espace numérique. Nos titres sont présents sur de nombreux réseaux sociaux et des blogs, où les publications sont ouvertes aux commentaires du public. La modération de ces pages est une responsabilité pour notre publication, une nécessité pour son image et une charge pour les équipes en charge de l'animation numérique. De plus, il est nécessaire de s'assurer que la modération des propos déposés par les internautes soit en ligne avec la Charte de bonnes pratiques de la publication. L'intelligence artificielle et les technologies du langage naturel peuvent-elles préparer, faciliter et accélérer la modération ?

Détecter des phénomènes et signaux peu perceptibles pour les opérateurs humains

Officier des forces de sécurité, j'anime une cellule de surveillance des réseaux criminels de toutes sortes, notamment à partir des interceptions de relations entre les membres de ces réseaux : texte, mais surtout enregistrements audio, dans les langues les plus diverses, parfois rares. Je sais que l'intelligence artificielle permet de mettre en évidence des faits d'intérêt majeur par l'analyse dans le temps de ces données textuelles et aimerais en savoir davantage.

Quantifier des opinions dans des réponses libres : un défi

Je suis décideur dans un institut d'études marketing et de sondage d'opinion. Je souhaite lancer des enquêtes incluant des questions ouvertes pour leur richesse. Mais comment dépouiller toutes ces contributions en texte libre ?

Les avis clients en texte libre : une mine de pépites, mais comment les extraire et les mesurer ?

Je dispose de contenus précieux reflétant l’expérience, la satisfaction, les attentes de mes clients. Mais autant les contenus en texte libre sont riches, autant ils sont complexes à exploiter. L'analyse linguistique peut-elle m'apporter une aide ?

Rédiger automatiquement des fiches prestataires et sociopro à partir d'avis clients

Je suis responsable d'une plateforme touristique d'un office de tourisme, et je souhaite proposer aux touristes potentiels des descriptions de mes prestataires et socioprofessionnels prenant en compte les avis clients.