Reconnaissance Optique de Caractères : quelle différence entre l'OCR et l'ICR ?
La reconnaissance optique de caractères (ou OCR) consiste à analyser un document disponible sous forme d’image, par exemple un document numérisé au moyen d’un scanner ou une photo, et à le transformer en une version texte directement analysable par un module de traitement automatique des langues. Cette opération utilise généralement des technologies de reconnaissance de formes à base de réseaux de neurones.
Un premier traitement consiste à identifier la ligne de base et à isoler les caractères. La reconnaissance de formes est ensuite appliquée sur les caractères isolés.
OCR ou ICR
L’acronyme anglais ICR signifie Intelligent Character Recognition pour Reconnaissance Intelligente de Caractères. Au-delà des subtilités technologiques, la principale différence entre l’OCR et l’ICR est que l’ICR intègre la reconnaissance de l’écriture manuscrite alors que l’OCR se limite aux caractères d’imprimerie.