Je suis professeur-chercheur et je travaille à la semi-automatisation d'exercices de paléontologie à l'attention des étudiants en histoire notamment. Pour cela, j'ai à ma disposition un corpus composé de manuscrits enluminés du Moyen Âge, mais les documents sont scannés et enregistrés sous la forme de collections d'images ou fichiers PDF sans texte sélectionnable. Or le corpus est composé de milliers de manuscrits, et je n'envisage pas de laisser une équipe d'humains tout retranscrire manuellement, tels des moines copistes pour ainsi dire. J'imagine que les outils du TAL, plus particulièrement l'OCR, pourront m'aider à rendre la tâche moins fastidieuse. Mais quelle méthode privilégier dans le cas particulier de manuscrits qui contiennent des éléments non textuels comme des ornements ainsi qu'une mise en page complexe avec, par exemple, des annotations dans les marges ?
|
Je suis chef de projet dans un grand groupe fournisseur d’énergies. J’anime régulièrement des réunions et j’ai besoin que ces réunions soient résumées afin de diffuser des comptes-rendus à mes équipes.
Je suis Directrice d'un Laboratoire de la Police Scientifique. Notre mission est d'effectuer des examens scientifiques et techniques sur demande des autorités judiciaires, de la police et de la gendarmerie, dans le but de constater les infractions pénales et d'identifier leurs auteurs. L'évolution croissante des usages des moyens numériques de communication s’accompagne malheureusement d’une hausse de la cybercriminalité. Dans ce cadre, je souhaite doter les équipes d’outils permettant de faciliter l’identification de cybercriminels à partir de textes numériques anonymes.
Je suis consultant fonctionnel dans une compagnie qui propose des solutions de paiement et je souhaite centraliser la terminologie employée dans notre entreprise au sein d'une seule ressource, afin d'assurer une communication claire entre les employés des différents services.
Je suis responsable d’une plateforme de bibliothèque numérique et je souhaite améliorer l’expérience des utilisateurs en perfectionnant le moteur de recherche de l’application.