Un ordinateur peut-il analyser les émotions ?

Le lan­gage humain est com­plexe. Apprendre à un ordi­na­teur ou à une machine com­ment ana­ly­ser les nuances, que ce soit au niveau gram­ma­ti­cal ou cultu­rel, ain­si que com­ment le contexte peut influen­cer le sens de la phrase, est un pro­ces­sus dif­fi­cile qui n’est pas impossible.

Que signifie l’analyse des sentiments ?

L’a­na­lyse des sen­ti­ments, éga­le­ment appe­lée opi­nion mining ou emo­tion ana­ly­sis en anglais, est un domaine d’é­tude consis­tant à ana­ly­ser les émo­tions, les sen­sa­tions et les atti­tudes des indi­vi­dus vis-à-vis des enti­tés telles que les pro­duits, les ser­vices, etc. Il s’a­git d’un des domaines de recherche les plus actifs en trai­te­ment auto­ma­tique de lan­gage natu­rel depuis le début des années 2000. 

L’a­na­lyse des sen­ti­ments vise à extraire des infor­ma­tions sub­jec­tives telles que des opi­nions et des sen­ti­ments à par­tir de textes éva­lua­tifs en lan­gage natu­rel sur des sites web et des médias sociaux. Elle per­met d’analyser auto­ma­ti­que­ment toutes ces don­nées tex­tuelles, de mieux com­prendre sa per­cep­tion et d’en faire res­sor­tir les dif­fé­rentes opi­nions expri­mées dans une men­tion en ligne, sur un sujet pré­cis comme une marque, une actua­li­té ou un produit.

Types d’analyse des sentiments 

Il y a de nom­breux types d’a­na­lyse des sen­ti­ments qui sont appliqués : 

  • Clas­si­fi­ca­tion des pola­ri­tés : posi­tive, néga­tive ou neutre ;
  • Détec­tion des émo­tions : joyeux, triste, en colère, etc. ;
  • Iden­ti­fi­ca­tion des inten­tions : inté­res­sé, pas inté­res­sé, etc..

Catégories des sentiments ?

Les sen­ti­ments sont géné­ra­le­ment clas­si­fiés en trois pola­ri­tés : posi­tive, néga­tive ou neutre.

Selon les mots et les phrases par­ti­cu­liers qui sont extraits, le texte ou la phrase sera catégorisé(e).

Ain­si, sui­vant le type d’a­na­lyse pré­dé­fi­ni, il est pos­sible d’a­voir des caté­go­ries plus fines, par exemple : 

  • Très posi­tive
  • Posi­tive
  • Neutre
  • Néga­tive
  • Très néga­tive

De ce fait, l’a­na­lyse des sen­ti­ments per­met d’a­na­ly­ser une grande quan­ti­té de don­nées afin de pou­voir faci­le­ment iden­ti­fier les sen­ti­ments associés.

Niveaux d’analyses

De manière géné­rale, il y a trois niveaux d’a­na­lyse des sentiments :

  • Niveau du docu­ment : la pola­ri­té du texte entier sera déter­mi­née. Cela signi­fie que le texte n’ex­prime qu’une seule opi­nion sur un seul concept/produit.
  • Niveau de la phrase : la pola­ri­té de chaque phrase dans le texte sera déter­mi­née. Cela signi­fie que chaque phrase exprime une opi­nion unique sur une enti­té unique. 
  • Niveau des aspects : ce niveau d’a­na­lyse qui est plus fin que les deux pré­cé­dents per­met d’a­na­ly­ser le texte afin d’i­den­ti­fier dif­fé­rents aspects et de déter­mi­ner le sen­ti­ment qui cor­res­pond pour cha­cun.

    Plus concrè­te­ment, pre­nons l’exemple sui­vant :
    « Cet ordi­na­teur est bien, mais il vaut mieux que sa bat­te­rie dure plus long­temps et qu’il soit plus léger à por­ter.« 

    Il y a trois aspects qui sont évalués : 
    • l’or­di­na­teur => positif ;
    • l’au­to­no­mie de la bat­te­rie => négatif ;
    • le poids => négatif.

Analyse des sentiments, comment ça marche ?

Il existe plu­sieurs façons d’analyser les sen­ti­ments, avec de nom­breux méthodes et algo­rithmes pour mettre en œuvre des sys­tèmes d’a­na­lyse des sen­ti­ments comme suit : 

  • Approche par appren­tis­sage auto­ma­tique super­vi­sé : repose sur des tech­niques d’ap­pren­tis­sage auto­ma­tique (Machine Lear­ning). Il s’a­git d’apprendre au sys­tème à clas­ser de façon auto­ma­tique sur la base de sta­tis­tiques, par exemple, un avis client est posi­tif, néga­tif ou neutre (en cas d’a­na­lyse de pola­ri­té).

    Pour que l’apprentissage auto­ma­tique fonc­tionne, il faut anno­ter un jeu de don­nées. Un algo­rithme pro­ba­bi­liste va ensuite ana­ly­ser cette anno­ta­tion afin d’en faire res­sor­tir des règles qui per­met­tront de clas­ser d’autres avis selon les polarités.
  • Approche à base de règles lin­guis­tiques : il s’a­git d’a­na­ly­ser un échan­tillon d’avis pour déter­mi­ner quels sont les mots ou les expres­sions qui indiquent le sen­ti­ment et ses dif­fé­rents degrés. Une fois cette ana­lyse lin­guis­tique effec­tuée, des règles de gram­maire qui seront créées per­met­tront au sys­tème de clas­ser chaque avis dans l’une ou l’autre des polarités. 
  • Approche hybride : cette méthode est assez intui­tive puis­qu’elle com­bine le meilleur des deux approches pré­cé­dentes. En com­bi­nant les deux approches, la pré­ci­sion peut être améliorée.

Les limites de l’analyse des sentiments

Des risques d’er­reur existent tou­jours dans n’im­porte quel pro­cé­dé auto­ma­ti­sé. L’in­ter­ven­tion humaine est sou­vent néces­saire dans ce cas afin d’as­su­rer la per­ti­nence de l’analyse. 

Cer­tains sys­tèmes se contentent de four­nir une tona­li­té glo­bale et de faire une extrac­tion de thème glo­bal, sans affi­ner au niveau des aspects men­tion­nés ci-des­sus. Les résul­tats sont alors moins pertinents.

Au-delà de la fia­bi­li­té, il est indis­pen­sable de prendre en compte que la com­mu­ni­ca­tion humaine ne se limite pas qu’à trois pola­ri­tés, posi­tive, néga­tive et neutre. 

Par Minh Anh Nguyen
Consultante NLP