Générer des bulletins de presse

|

|

Le besoin
La solution
Ils peuvent vous aider

Le besoin

Produire et publier des centaines de commentaires d'actualité en quelques minutes

L'actualité en temps quasi-réel : une exigence devenue un standard

Mes titres de presse en ligne opèrent dans un contexte hautement concurrentiel pour gagner l’audience.  La fraîcheur de l'information constitue un enjeu décisif : le lecteur s'attend à trouver à chaque clic une actualité en temps réel ou presque. L'audience et ses recettes associées se jouent en minutes de délais de publication.

Les technologies de traitement du langage sont-elles capables aujourd'hui de produire automatiquement et massivement des bulletins à  partir de données brutes disponibles pour un domaine d'information, telles que : résultats sportifs, données météorologiques, résultats d'élections, données de veille sanitaire ?

Générer automatiquement des bulletins de presse : vite mais bien !

Je dois bel et bien viser une qualité de langue qui fasse ignorer le mode de production automatisé, quelle que soit la difficulté de concilier traitement de masse, publication quasi-instantanée et qualité de rédaction.

En outre, je dois conformer les contenus aux contraintes de référencement, de structuration (par exemple la présence d'une accroche) et de style (charte éditoriale de la publication).

Je souhaite même aller plus loin et générer des bulletins de presse en plusieurs langues à partir des mêmes données pour assurer la mise en ligne simultanée des informations sur mes sites localisés.

La solution

La génération automatique de bulletins de presse : une réalité opérationnelle

La solution est adossée essentiellement à une fonction de génération automatique de texte.

Génération automatique : transformer des données en texte bien formé

La génération de texte opère sur des  données de typologie régulière, structurées de manière relativement régulière également : le système doit pouvoir reconnaître à quoi il a affaire.

La fonction de génération de texte consiste à associer ces données à des connaissances contenues dans le système pour construire du texte bien formé dans la ou les langue(s) visée(s).

Les connaissances embarquées par la solution sont d'ordre lexical (vocabulaire), phraséologique (expressions, tournures)  et des règles de construction (syntaxiques, pragmatiques) acquises soit de manière déclarative (par une opération humaine), soit par un apprentissage (machine learning, deep learning), souvent par une approche hybride.

Ce type de technologies est devenu une réalité opérationnelle dans divers domaines d'application pour les médias : résultats sportifs, bulletins météo, informations financières.

En option : traduction automatique, génération multilingue, synthèse vocale

Selon les besoins propres à la publication, la solution peut être complétée par diverses fonctions.

Un besoin de publication multilingue à partir des mêmes données peut appeler une fonction de traduction automatique des bulletins  ou bien de génération directement dans plusieurs langues à partir du même ensemble de données.

Une fonction de synthèse vocale peut compléter le dispositif si la publication de podcasts est attendue.

Points d'attention

Veiller à la qualité des données sources

La qualité des textes générés dépend fortement de la qualité des données disponibles en entrée : structure des données, complétude, cohérence, fiabilité... Un travail préalable sur ces données pourra être nécessaire lors de la mise en œuvre d'une solution de génération automatique.

Diversité des compétences requises

La conception fonctionnelle de la solution fait appel à des compétences variées : spécialistes des données, linguistes,  rédacteurs, voire juristes pour cadrer les conditions de conformité des contenus à produire, ou  encore spécialistes du webmarketing pour optimiser le référencement des contenus produits.

Mesurer les gains : audience, référencement, productivité, visibilité

Le ROI d'une solution de génération automatique peut se mesurer :

  • En termes d'audience par le différentiel constaté après mise en place de la solution, toutes choses égales par ailleurs (contrainte la plus complexe à satisfaire),
  • En termes de visibilité par le référencement des contenus générés automatiquement,
  • En termes de productivité, par le temps de travail nécessaire à la production des mêmes contenus sans automatisation, rapporté au coût (initial et récurrent) consacré à la solution automatique.
Par Christine Reynaud
Chef de projet contenus numériques

Ils peuvent vous aider

Demande de mise en relation concernant l'étude de cas Générer des bulletins de presse
Veuillez recopier le texte ci-dessous afin de pouvoir envoyer votre message. Attention aux majuscules !
 
Datapolitics met la donnée au service de l'action publique. La data est partout, volumineuse, et peu structurée : son utilisation dépasse rapidement le cadre du fichier Excel. Avec Datapolitics, passez la vitesse supérieure en bénéficiant des multiples possibilités offertes par la datascience. Propulsez vos contenus au meilleur niveau grâce à nos algorithmes et nos intelligences artificielles. Nous collectons aujourd'hui les prises de position des gouvernants ou de ceux qui aspirent à le devenir et produisons des analyses automatiques au travers de la plateforme Hedwige.
 
Leader des technologies d'investigation et services pour la sécurité globale.
 
Semantiweb apporte un décodage marketing des contenus conversationnels spontanés des internautes. Cette expertise donne une valeur stratégique aux annonceurs, permet de créer une intimité clients, détecte les tendances de consommation et traduit les insights des marchés en les rendant opérationnels pour l’entreprise, la marque et le produit.
 
Lingua Custodia est une Fintech leader du Traitement Automatique des Langues (TAL) pour la Finance basée en France et au Luxembourg. Elle a développé son expertise avec une offre pointue de traduction automatique spécialisée par type de document financier. La société propose aujourd'hui également des services de transcription automatique, des services d'analyse linguistique de document et des services d'extraction de données via sa plateforme en ligne ou par API. Ses clients sont des institutions financières et les départements financiers de grandes sociétés et ETI.
 
Callity est né en 2018 du constat que les solutions de Quality Monitoring et de Speech Analytics traditionnelles étaient dépassées. Qui peut dire aujourd’hui qu’il exploite pleinement l’ensemble de ses interactions clients ? Personne ! Chez Callity nous oeuvrons pour changer cela via une plateforme SaaS moderne, utilisant pleinement les possibilités offertes par l'intelligence artificielle, qui permette aux marques d'exploiter 100% des conversations clients et les transformer en stratégies d'acquisition, de fidélisation et de formation efficaces.
 
QWAM développe des solutions logicielles d'intelligence artificielle appliquée au traitement du langage naturel. Nos solutions combinent les approches sémantiques, big data, machine learning et deep learning. QWAM intervient pour répondre aux besoins d'exploitation avancée des données textuelles existantes au sein des entreprises et organisations ou bien disponibles sur le web.
 
Yseop’s Augmented Analyst platform brings natural language generation and other advanced technologies together to offer automation fit for regulated industries.
 
Synapse est expert en Intelligence Artificielle appliquée au texte. Notre raison d'être est d'accompagner nos clients dans la transmission de leurs connaissances. En ce sens, Synapse intervient tout au niveau de 3 leviers : - Créer de la connaissance, à travers un outil d'aide à l'écriture qui permet d'écrire l'esprit libre : Cordial. - Structurer de la connaissance, à travers des outils d'analyse sémantique. - Partager de la connaissance, à travers un chatbot capable de se connecter à la documentation d'une entreprise et de générer automatiquement sa base de connaissances.
 
Kairntech développe une plateforme d'IA visant à démocratiser et accélérer le développement d'applications basées sur le TAL au sein de l’entreprise. L’objectif est de pouvoir créer rapidement et sans programmation des robots permettant d’analyser automatiquement de grandes quantités de texte avec une très grande précision, faisant économiser du temps et des efforts. Nous aidons les professionnels de l’information et les analystes (auditeurs, analystes marketing, chercheurs scientifiques, enquêteurs…) à bâtir des applications pour gagner en efficacité tout en prenant de meilleures décisions.
 
L'APIL, association à but non lucratif, rassemble l'expertise des personnes et des industriels du traitement automatique des langues. Elle a pour ambition de promouvoir le traitement automatique des langues auprès des utilisateurs, qu'ils soient industriels ou grand public. Nous animons un réseau d'expertise en collaboration avec les acteurs spécialisés du domaine : forum JeunesTalents en collaboration avec l'ATALA, les rencontres entre membres industriels, ou l'accompagnement de projets collaboratifs innovants en partenariat international.

Vous fournissez de telles solutions et vous souhaitez faire partie de nos partenaires, contactez-nous.

Les technologies à mettre en oeuvre

Qu'est-ce que la normalisation de textes ?
Quand est-il nécessaire de normaliser des textes ? La nor­ma­li­sa­tion de textes consiste à pré­pa­rer les textes pour effec­tuer un trai­te­ment auto­ma­tique du conte­nu de plus...
Comment un ordinateur peut-il aider à traduire ?
De quand date la traduction automatique ? Les pre­mières solu­tions de tra­duc­tion auto­ma­tique et de tra­duc­tion assis­tée par ordi­na­teur sont appa­rues dès le milieu du XXème...
Comment fonctionne la synthèse vocale ?
Synthèse de la parole, synthèse vocale, Text to Speech, TTS, de quoi parle-t-on ? Syn­thèse de la parole, syn­thèse vocale, Text to Speech, TTS, tous ces...
Comment fonctionne la génération de texte ?
Que signifie le sigle NLG ? NLG est l’a­cro­nyme anglais de « Natu­ral Lan­guage Gene­ra­tion », en d’autres termes géné­ra­tion (de textes) en lan­gage natu­rel. Il s’a­git de faire...

Ces études de cas peuvent aussi vous intéresser

Créer la base de connaissances d'un chatbot

Je suis responsable commercial d'un site de vente en ligne de produits techniques et je souhaite intégrer à mon site un chatbot pour guider mes clients vers leurs achats en les accompagnant dans leur choix. Je ne sais pas par où commencer pour fournir les connaissances nécessaires à notre futur chatbot.

Un système de questions-réponses basé sur les commentaires de clients

Je suis responsable des ventes d'une entreprise de vente en ligne. Nous avons une section de commentaires où les clients publient leurs expériences d'utilisation ainsi qu'une section de questions où les prospects se renseignent sur des produits. La section de commentaires constituant une source d'informations précieuse contenant souvent des éléments non contenus dans les fichiers descriptifs envoyés par des fournisseurs, je voudrais savoir comment les avis clients peuvent être exploités afin de proposer des réponses automatiques aux questions des prospects.

Création automatique des dossiers de crédit d'entreprise

En tant que responsable de la direction finances et risques d'une banque, je souhaite mettre en place un processus de création automatique des dossiers de crédit aux entreprises à partir des éléments clés : projets de financement, santé financière de l'entreprise, garanties apportées, etc. Cette solution devra être déployée sur l'ensemble du groupe, et notamment être accessible à tous les "risk managers" de l'établissement.