Neoptec - le spécialiste de la lecture automatique de documents par scanner et de l’acquisition de données par internet

Retour à la page d'accueil

Glossaire

Application Programming Interface (API)

Une API consiste en un ensemble de routines, de protocoles et d'outils permettant à un développeur informatique d’intégrer des applications spécifiques à un logiciel. Ainsi, une API s'incorpore directement dans de nouveaux logiciels.

NEOPTEC est propriétaire de l'ensemble des moteurs API intégrés à ses applications pour effectuer le traitement d'images et la reconnaissance de caractères OCR, ICR et CMC7.

Docimologie

Terme désignant la science de l'évaluation, la docimologie s'occupe des facteurs qui peuvent peser dans la notation de travaux par des évaluateurs. Des études docimologiques ont démontré, par exemple, qu'il y aura souvent un écart considérable entre les notes attribuées à une même copie par deux correcteurs différents.

C'est suite aux effets mis en évidence par de telles études que différentes stratégies censées apporter plus d'objectivité dans des processus de notation ont été adoptées dans divers pays. Ainsi, des solutions telles que la double correction, la notation anonyme et l'utilisation de formats à réponses invariables (QCM, questionnaires à réponses courtes, etc.) ont réduit ou éliminé certains types de biais dans la notation.

Des avancés technologiques ont, par ailleurs, permis l'automatisation de la correction de certains types d'épreuves, notamment des QCM. De ce fait, des QCM correctement conçus peuvent constituer une forme d'évaluation particulièrement intéressante pour comparer un grand nombre de candidats sur des critères fixes. C'est pourquoi ce type d'épreuve, qui reste néanmoins complémentaire à d'autres formes d'évaluation, joue souvent un rôle clé dans des processus nécessitant des critères de notation parfaitement transparents.

Si NEOPTEC s'est efforcé de développer un outil de correction automatique de nouvelle génération, c'est pour restituer aux professionnels de l'enseignement et de l'évaluation toute leur importance dans la conception d'évaluations intelligentes.

Dédié

Un outil ou un appareil est dit "dédié" quand il est consacré à une seule et unique fonction.

Intelligent Character Recognition (ICR)

Une forme d'intelligence logicielle, l'ICR est le procédé par lequel une application reconnaît les caractères alphanumériques que comporte un texte manuscrit. Une application intégrant l'ICR effectue cette reconnaissance à partir d'images numériques, celles-ci étant obtenues le plus souvent par l'intermédiaire d'un scanner à images.

Cette technologie clé pour le développement de solutions permettant une automatisation intelligente de la saisie de données sur différents types de documents structurés (et donc optimisable pour une reconnaissance parfaite) s'intègre le plus souvent dans un système de Lecture Automatique de Documents plus global, afin de traiter des formulaires, des questionnaires, des enquêtes et tout autre type de document structuré ou semi-structuré.

Selon le niveau de structuration de l'écriture et la manière dont sont définis les différents champs sur un document destiné à la lecture par une application ICR, le taux de reconnaissance peut être plus ou moins élévé. Le système utilisé dans le logiciel OCR / ICR universel de NEOPTEC, a été abondamment testé en comparaison avec la saisie manuelle et témoigne systématiquement d'un niveau de perfection des données lues supérieur à la saisie au clavier par un opérateur de saisie professionnel.

Lecteur Optique

Il s'agit d'un appareil spécifique dédié à la reconnaissance optique de marques (OMR) sur un papier imprimé avec des encres spéciales. Les lecteurs optiques ont permis une première avancée vers l'automatisation à grande échelle de certains types de traitements de documents, notamment pour des formulaires standards et des examens par QCM.

Encore utilisé dans bon nombre d'établissements d'enseignement, d'organismes de santé et d'instances du service public, surtout dans le monde anglo-saxon, le lecteur optique cède progressivement du terrain à des technologies plus récentes, qui sont souvent plus souples, plus fiables et plus précises.

Les technologies de Lecture Automatique de Documents (LAD), par exemple, permettent de lire par scanner des documents très variés et complexes. La LAD reconnaît directement des caractères typographiques et manuscrits sur des documents conçus avec un traitement de texte classique et imprimés sur du papier ordinaire avec une simple imprimante de bureau.

A la différence de la reconnaissance optique de marques, les procédés de type LAD effectuent la reconnaissance d'objets à partir d'images à haute résolution obtenues suite à la numérisation par un scanner. Ces images sont ensuites archivées et disponibles pour consultation. Ainsi, les utilisateurs d'outils LAD peuvent contrôler à tout moment l'acquisition des données effectuée automatiquement.

Lecture Automatique de Documents (LAD)

La Lecture Automatique de Documents, ou la LAD, est une technologie qui permet de lire par scanner les informations portées sur des documents papier et transformer celles-ci en données numériques.

La LAD exploite un ensemble d'avancées techniques dans le traitement d'images et dans l'utilisation de réseaux neuronaux pour constituer une sorte d'intelligence logicielle. Cette technologie permet aux logiciels NEOPTEC de saisir, d'analyser, de contrôler et d'exporter des données lues à partir des images de documents numérisées par un scanner.

Les applications de LAD reconnaissent différents types d'objets, selon les moteurs de reconnaissance utilisés. Les moteurs intégrés dans les logiciels de NEOPTEC, par exemple, peuvent reconnaître non seulement des caractères et des marques imprimés ou manuscrits (OCR et ICR), ainsi que des codes à barres, mais aussi d'autres types d'objets, dont les échelles de valeur, le Sema-code, le CMC7 (code utilisé sur les bordereaux de chèques), etc.

Pour en savoir plus sur notre logiciel de LAD universel, veuillez consulter les pages DATA-SCAN. NEOPTEC a également conçu plusieurs logiciels de LAD dédiés pour le domaine de l'évaluation, dont QCM Direct, NEMO-SCAN et Transcript.

Optical Character Recognition (OCR)

La forme d'intelligence logiciel qui est historiquement au fondement de la technologie de la Lecture Automatique de Documents, l'OCR est le procédé par lequel une application reconnaît les caractères alphanumériques figurant sur un document imprimé pour les transformer en symboles numériques et éditables (ASCII, par exemple). Une application intégrant l'OCR effectue cette reconnaissance à partir d'images numériques, celles-ci étant obtenues le plus souvent par l'intermédiaire d'un scanner à images.

Les moteurs de reconnaissance OCR utilisés dans les logiciels NEOPTEC permettent une saisie parfaite de tout type de police de caractère imprimé (lettres latines, chiffres, symboles). Voir aussi ICR.

Reconnaissance de caractères

Procédé par lequel des symboles sont lus en tant que symboles, la reconnaissance de caractères (ou la reconnaissance optique de caractères) permet la lecture de symboles imprimés et manuscrits lors de la numérisation du document sur lequel ils figurent (voir aussi OCR et ICR).

Le terme « reconnaissance de caractères » est parfois employé de façon plus large pour désigner la lecture de l'ensemble des différents types de données qui peuvent être reconnus par la technologie de la Lecture Automatique de Documents.

Les moteurs de reconnaissance utilisés dans les logiciels NEOPTEC permettent de lire, en plus des autres objets de lecture, n'importe quel symbole utilisé dans l'écriture et la typographie occidentale.