A brief history of OCR: the technology inside your ScanMarker

Une brève histoire de l'OCR : la technologie à l'intérieur de votre ScanMarker

Le ScanMarker et le ScanMarker Air sont tous deux des appareils OCR. Ces outils de productivité multifonctions sont à la pointe de la technologie moderne et offrent de nombreux avantages aux personnes du monde entier. Nous avons été contactés par des étudiants qui prenaient des notes d'étude, des avocats qui préparaient des dossiers juridiques, des médecins qui retranscrivaient des dossiers de patients et tout un tas de journalistes, blogueurs et historiens qui reprenaient des citations précises de sources originales avec leur ScanMarker. De plus, nous avons reçu des remerciements de personnes souffrant de troubles de l'apprentissage, de personnes malvoyantes, de personnes qui apprennent une langue étrangère et de parents d'enfants ayant des besoins éducatifs spéciaux pour l'aide que notre appareil leur apporte dans leur vie quotidienne.

Mais comment en sommes-nous arrivés là ? Qu'est-ce que la technologie OCR et d'où vient-elle ?

Une brève explication

L’OCR est l’abréviation de reconnaissance optique de caractères. Il décrit le processus de conversion d’un texte physique (c’est-à-dire une page imprimée dans un livre, un journal ou un magazine) en données électroniques. Ces données peuvent ensuite être utilisées de différentes manières. Le ScanMarker, par exemple, convertit ces données en audio afin de pouvoir vous lire le texte. Il peut également le traduire dans différentes langues, le copier dans des documents et bien plus encore. L’OCR est un mélange remarquable de vision par ordinateur, de reconnaissance de formes et d’intelligence artificielle. L’appareil voit littéralement le texte à travers son scanner, reconnaît les formes des lettres individuelles, puis comprend ce que ces formes signifient en tant que caractères à part entière, ainsi qu’en conjonction avec les autres lettres qui les entourent.

Là où tout a commencé

Étonnamment, l’OCR est une invention d’avant-guerre, et par avant-guerre, nous ne parlons pas de la Seconde Guerre mondiale, mais de la Grande Guerre, voire de la Première Guerre mondiale. Pour quelque chose que nous imaginons être une innovation moderne, les racines de l’OCR remontent à 1914. Cette année-là, deux hommes, Emanuel Goldberg et Edmund Fournier d’Albe, ont développé, indépendamment l’un de l’autre, les premiers appareils OCR. Goldberg a inventé une machine capable de lire des caractères et de les convertir en code télégraphique. Pendant ce temps, d’Albe a créé un appareil connu sous le nom d’Optophone. Il s’agissait d’un scanner portatif qui pouvait être déplacé sur une page de texte imprimé, produisant des tons distincts et séparés, chacun correspondant à un certain caractère ou à une certaine lettre. Bien que cela ressemble plus à une nouveauté qu’à un outil OCR sérieux, il n’est pas impossible d’imaginer un appareil frère qui pourrait entendre ces tons joués dans l’ordre et reconstituer les mots sur un nouveau support. Les progrès technologiques mis à part, c’est essentiellement ainsi que fonctionne l’OCR aujourd’hui.

Plus grand et meilleur

Goldberg a continué à améliorer cette technologie OCR latente, passant les années entre les deux guerres à développer une « machine statistique ». Cet appareil était en fait le premier moteur de recherche au monde et utilisait l’OCR pour rechercher des modèles de caractères particuliers dans les archives de microfilms. Il a obtenu un brevet aux États-Unis pour cette invention, un brevet qui a été acquis par nul autre que le géant informatique IBM.

Élargir le champ

Les premiers appareils OCR avaient bien sûr leurs limites. Plus précisément, ils ne pouvaient reconnaître que du texte parfait, c’est-à-dire un texte parfaitement droit, parfaitement clair et imprimé dans la police unique que ces appareils étaient programmés pour reconnaître. Les machines comparaient en fait le caractère qu’elles scannaient à une base de données de caractères pour voir si elles pouvaient trouver une correspondance. Les limites de la mémoire informatique étant ce qu’elles étaient, ces bases de données étaient nécessairement petites et n’offraient aucune marge de manœuvre aux utilisateurs. Soit la police correspondait exactement, soit le lecteur ne parvenait pas à la reconnaître.

Avec l'augmentation de la puissance de traitement des ordinateurs dans les années 60 et 70, les lecteurs OCR omni-polices sont devenus la norme. Ces scanners ne recherchaient pas une correspondance exacte. Au lieu de cela, ils commençaient à reconnaître la forme générale, malgré les différences de conception des polices.

Entrer dans l'ère moderne

Les appareils OCR tels que nous les connaissons aujourd'hui ont sans aucun doute vu le jour avec Kurzweil Computer Products, Inc., fondée en 1974. Autre appareil omni-polices, Kurzweil a inventé une application pour ce matériel qui était franchement révolutionnaire. Son idée était de développer une machine de lecture pour les aveugles, une machine qui permettrait aux malvoyants de se faire lire un livre par un ordinateur. C'était une autre invention en avance sur son temps et certainement hors de portée du public payant. Cependant, non seulement la machine elle-même était une réflexion sérieuse de nouvelle génération, mais elle a également produit deux technologies qui sont devenues partie intégrante de la plupart des systèmes OCR. Il s'agissait du synthétiseur de texte-parole et du scanner à plat.

Un monde électronique en constante évolution

Au 21e siècle, l'OCR a vraiment pris son essor. En l'associant à la technologie Internet, les applications possibles de l'OCR sont devenues une réalité. La reconnaissance des caractères s'est élargie, la plupart des polices de caractères étant prises en compte, et le scanner à plat a cédé la place à l'appareil portable. À mesure que les algorithmes de reconnaissance sont devenus plus sophistiqués et que les scanners optiques ont commencé à gérer des résolutions de plus en plus élevées, de nouvelles utilisations intéressantes de cette technologie sont devenues disponibles. Vous êtes-vous déjà retrouvé coincé dans un pays étranger avec des panneaux dans une langue que vous ne comprenez pas ? Désormais, vous pouvez simplement prendre une photo, la traiter dans une application OCR et elle reconnaîtra les mots, la langue et pourra vous la traduire.

Ce type de logiciel de vérification instantanée a révolutionné notre façon de faire des affaires. Il peut reconnaître des factures et des reçus, des passeports, des plaques d'immatriculation de voiture, des documents d'assurance et bien plus encore, et savoir ensuite quoi faire de ces informations.

Des sites comme Project Gutenberg ont utilisé la précision améliorée de la technologie OCR pour numériser des textes anciens actuellement dans le domaine public, afin de produire des versions électroniques exactes et complètes des classiques, qu'ils offrent gratuitement. Google Books est allé plus loin en permettant à ses utilisateurs de rechercher des mots et des phrases dans l'image numérisée d'origine, et pas seulement dans les données électroniques.

Avec autant d'utilisations dans le monde, l'OCR est l'une de ces technologies que presque tout le monde utilise, mais dont personne ne parle, et c'est dommage.

Et ensuite ?

L'OCR a connu un long cheminement, depuis le lecteur de livres musicaux de 1914 jusqu'à la myriade d'applications qui utilisent cette technologie aujourd'hui. Chez ScanMarker, nous nous efforçons en permanence d'améliorer la qualité et la fonctionnalité de nos propres appareils OCR, le ScanMarker et le ScanMarker Air, en nous plaçant constamment à l'avant-garde du domaine. Pourquoi ne pas faire partie de ce voyage vous-même ? Procurez-vous un ScanMarker dès aujourd'hui et voyez comment vous pouvez changer votre monde.

Retour au blog

Laisser un commentaire

Veuillez noter que les commentaires doivent être approuvés avant d'être publiés.