Participation à la journée Ethique et TAL de l'ATALA

Hugues de Mazan­court, Pré­sident de l’A­PIL, est inter­ve­nu lors de la jour­née Ethique et TAL orga­ni­sée par l’A­TA­LA à l’oc­ca­sion du 10ème anni­ver­saire la Jour­née Ethique et TAL https://www.atala.org/content/ethique-tal

La pré­sen­ta­tion, inti­tu­lée Nor­ma­li­ser l’IA, une réponse au dilemme éthique des indus­triels de la langue fait suite à un article à paraître pro­chai­ne­ment dans les actes de la conférence. 

Les LLM sont deve­nus incon­tour­nables dans l’offre des acteurs du Trai­te­ment auto­ma­tique des langues, non seule­ment du fait de leur effi­ca­ci­té, mais éga­le­ment parce qu’ils sont entrés dans le dis­cours des clients, des inves­tis­seurs, et même du grand public.
L’ap­pa­ri­tion des LLM dans les solu­tions de trai­te­ment de la langue n’est pas neutre pour un indus­triel, en par­ti­cu­lier du point de vue du res­pect de l’é­thique.
La pro­messe (tech­nique) des grands modèles de langue est sédui­sante : prendre un modèle exis­tant, entraî­né (à des coûts qui deviennent astro­no­miques sur des archi­tec­tures tierces) afin qu’il intègre les géné­ra­li­tés de la langue. Ensuite ce modèle est affi­né (fine-tuned) sur des don­nées spé­ci­fiques à la tâche. On parle de Modèles de Fon­da­tion.

Mais la mise en œuvre est plus com­plexe.
L’ar­ticle, et la pré­sen­ta­tion, aborde quelques facettes de cet état des choses, et notam­ment concernant : 

  • les don­nées d’en­traî­ne­ment et leur traçabilité,
  • le point de vue des uti­li­sa­teurs et le foi­son­ne­ment des contraintes légales, 
  • l’en­ca­dre­ment par la loi.