Je suis responsable produit au sein d'une entreprise biopharmaceutique spécialisée dans le développement d'une solution de désensibilisation à certains allergènes. Depuis la phase de recherche jusqu'à la commercialisation du produit, plusieurs milliers de documents ont été générés. Certains de ces documents sont régulièrement consultés par nos équipes de contrôle qualité, mais la taille conséquente des fichiers complexifie la recherche ciblée d'informations à reporter. Ce délai ralenti notre processus de contrôle qualité. Est-il possible de mettre en place un outil capable d'extraire les données numériques et textuelles qui permette la relecture assistée de textes pharmaceutiques ?
|
Je suis professeur-chercheur et je travaille à la semi-automatisation d'exercices de paléontologie à l'attention des étudiants en histoire notamment. Pour cela, j'ai à ma disposition un corpus composé de manuscrits enluminés du Moyen Âge, mais les documents sont scannés et enregistrés sous la forme de collections d'images ou fichiers PDF sans texte sélectionnable. Or le corpus est composé de milliers de manuscrits, et je n'envisage pas de laisser une équipe d'humains tout retranscrire manuellement, tels des moines copistes pour ainsi dire. J'imagine que les outils du TAL, plus particulièrement l'OCR, pourront m'aider à rendre la tâche moins fastidieuse. Mais quelle méthode privilégier dans le cas particulier de manuscrits qui contiennent des éléments non textuels comme des ornements ainsi qu'une mise en page complexe avec, par exemple, des annotations dans les marges ?
Je suis responsable d’une plateforme de bibliothèque numérique et je souhaite améliorer l’expérience des utilisateurs en perfectionnant le moteur de recherche de l’application.
Je suis responsable d'un site internet qui propose des voyages organisés sur mesure. Nous collaborons avec de nombreuses agences partenaires à travers le monde. Les retours d'expérience de nos clients sont nombreux et publiés via divers canaux tels que les mails, les réseaux sociaux et notre site internet. Ces messages sont importants car ils nous aident à maintenir la qualité de nos circuits, et à mieux comprendre les désirs de notre clientèle. Est-il possible d'utiliser ces messages pour détecter les tendances et continuer à améliorer nos services ?
Je suis associée dans un cabinet d’avocats spécialisé en droit des affaires. Je voudrais fournir aux avocats et juristes de notre cabinet des outils efficaces pour identifier la jurisprudence utilisable dans la construction de leurs arguments. Actuellement, ce processus est chronophage et comporte le risque de ne pas repérer les décisions les plus pertinentes. La masse d'informations disponible rend difficile l'obtention d'une vision claire de l'évolution de la jurisprudence, ce qui peut d’ailleurs entraîner des lacunes concernant les revirements de jurisprudence. Le Traitement Automatique des Langues peut-il aider à réduire le temps et le niveau d’expertise nécessaire pour trouver les jurisprudences pertinentes ?