Je suis professeur-chercheur et je travaille à la semi-automatisation d'exercices de paléontologie à l'attention des étudiants en histoire notamment. Pour cela, j'ai à ma disposition un corpus composé de manuscrits enluminés du Moyen Âge, mais les documents sont scannés et enregistrés sous la forme de collections d'images ou fichiers PDF sans texte sélectionnable. Or le corpus est composé de milliers de manuscrits, et je n'envisage pas de laisser une équipe d'humains tout retranscrire manuellement, tels des moines copistes pour ainsi dire. J'imagine que les outils du TAL, plus particulièrement l'OCR, pourront m'aider à rendre la tâche moins fastidieuse. Mais quelle méthode privilégier dans le cas particulier de manuscrits qui contiennent des éléments non textuels comme des ornements ainsi qu'une mise en page complexe avec, par exemple, des annotations dans les marges ?
|
Je suis responsable d’une plateforme de bibliothèque numérique et je souhaite améliorer l’expérience des utilisateurs en perfectionnant le moteur de recherche de l’application.
Je suis responsable pédagogique dans une école où sont scolarisés plusieurs enfants dyslexiques. Ces derniers rencontrent des problèmes de compréhension de lecture. Quelle solution puis-je mettre en place pour faciliter leur apprentissage au quotidien ?
Je suis programmatrice et animatrice de conférences au sein d’un centre de culture scientifique. J’organise régulièrement des conférences au cours desquelles des chercheurs et des chercheuses évoluant dans différentes disciplines viennent partager leur savoir avec le grand public. Nous disposons d’une centaine d’heures d’enregistrements audio. Je souhaite transcrire les interventions afin de les diffuser par écrit sur le blog du centre de culture scientifique.
En tant qu’expert en affaires publiques, j’ai besoin de connaître quelles sont les parties prenantes pour les dossiers qui me sont confiés. Cela implique d’identifier qui sont les parlementaires, syndicalistes, responsables d’association, responsables de grandes entreprises actifs sur chacun de ces sujets et quelles sont leurs prises de position. Ces informations sont cruciales pour bâtir ma stratégie d’influence (qui contacter, avec quels arguments) afin de concrétiser dans la loi les engagements que je porte. Cette vision doit être à large spectre (Parlement, mais aussi presse et réseaux sociaux) et mise à jour au fil de l’actualité et des interventions des parties prenantes. J’ai besoin d’outils intelligents pour automatiser et fiabiliser cette analyse qui aujourd’hui est essentiellement manuelle.