Les inconvénients de ocr

<

Contenu

article data-type="article">
logiciel OCR convertit une image d`un document texte électronique.

Le US Postal Service utilise la reconnaissance optique de caractères (OCR) pour lire les adresses sur des pièces de courrier. Pour le courrier à être lisible par un courrier trieur OCR, cependant, les adresses et les polices doivent être formatées d`une certaine façon. logiciel OCR est utile pour convertir des images numérisées de documents dactylographiés ou manuscrits en texte électronique consultable, mais il présente des inconvénients qui limitent ses applications.

Documents limitées

  • OCR fonctionne mieux avec des documents de bonne qualité dactylographié. Les documents manuscrits ne peuvent pas être facilement lu par un logiciel OCR. De même, tapé des polices qui ressemblent à l`écriture - ainsi que les polices non latins - créer beaucoup d`erreurs au cours du processus OCR. Si le document a un faible contraste, est froissé ou sale, ou le texte et l`arrière-plan sont similaires dans l`obscurité, puis OCR ne fonctionne pas bien. OCR a de la difficulté avec des documents qui ont à la fois des images et du texte. Spreadsheets produira également plus d`erreurs.

exactitude




  • Aucun logiciel OCR est de 100 pour cent exact. Le nombre d`erreurs dépend de la qualité et le type de document, y compris la police utilisée. Les erreurs qui se produisent lors de la reconnaissance comprennent des lettres mauvaise lecture, sauter par-dessus des lettres illisibles, ou à mélanger ensemble du texte à partir des colonnes adjacentes ou les légendes des images. Si une grande précision est nécessaire - comme avec la conversion de livres numériques au format électronique - puis un nettoyage du texte électronique sera nécessaire.

Work-Arounds

  • OCR a des difficultés à différencier entre les caractères, tels que le nombre zéro et un capital "O." Pour contourner ce problème, une police spéciale OCR peut être utilisé, comme l`écriture sur zéro. Cependant, cela ne fonctionne que pour les documents créés avec OCR à l`esprit, comme les questionnaires. Lors de la création de questionnaires qui seront écrits à la main, les chercheurs utilisent aussi des boîtes pour chaque lettre.

Travail supplémentaire

  • Même si l`image numérisée du document original est de haute qualité, des mesures supplémentaires doivent se produire pour nettoyer le texte OCR. Il est très en main-d`œuvre pour corriger les erreurs créées par OCR. Une personne doit comparer manuellement le document original et le texte électronique. Les gens font aussi des erreurs lors de la saisie de texte à partir d`un document, mais il est parfois plus rapide de sauter l`étape de l`OCR.

AUTRES

» » » » Les inconvénients de ocr