A brief history of OCR: the technology inside your ScanMarker

Un breve historial de OCR: la tecnología dentro de su escaneo

11 de mayo de 2023

Tanto el ScanMarker como el ScanMarker Air son dispositivos de reconocimiento óptico de caracteres (OCR). Estas herramientas multifuncionales de productividad están a la vanguardia de la tecnología moderna y ofrecen una amplia gama de beneficios a personas de todo el mundo. Nos han contactado estudiantes que toman apuntes, abogados que preparan informes legales, médicos que transcriben expedientes de pacientes y numerosos periodistas, blogueros e historiadores que utilizan su ScanMarker para obtener citas precisas de fuentes originales. Además, hemos recibido el agradecimiento de personas con discapacidad intelectual, personas con discapacidad visual, personas que aprenden un idioma extranjero y padres de niños con necesidades educativas especiales por la ayuda que nuestro dispositivo les brinda en su vida diaria.

Pero ¿cómo llegamos hasta aquí? ¿Qué es la tecnología OCR y de dónde proviene?

Una breve explicación

OCR es la abreviatura de reconocimiento óptico de caracteres. Describe el proceso de convertir texto físico (es decir, una página impresa de un libro, periódico o revista) en datos electrónicos. Estos datos pueden utilizarse de diversas maneras. El ScanMarker, por ejemplo, convierte esos datos en audio para poder leer el texto. También puede traducirlo a diferentes idiomas, copiarlo en documentos y mucho más. El OCR es una combinación excepcional de visión artificial, reconocimiento de patrones e inteligencia artificial. El dispositivo ve el texto a través de su escáner, reconoce la forma de cada letra y comprende su significado como caracteres, tanto en sí mismos como en conjunto con las demás letras que los rodean.

Donde todo empezó

Sorprendentemente, el OCR es una invención de preguerra, y por preguerra no nos referimos a la Segunda Guerra Mundial, sino a la Primera Guerra Mundial. Para ser una innovación moderna, sus orígenes se remontan a 1914. Ese año, dos hombres, Emanuel Goldberg y Edmund Fournier d'Albe, desarrollaron, de forma independiente, los primeros dispositivos de OCR. Goldberg inventó una máquina capaz de leer caracteres y convertirlos en código telegráfico. Por su parte, d'Albe creó un dispositivo conocido como Optophone. Se trataba de un escáner portátil que se movía por una página de texto impreso y producía tonos distintos e independientes, cada uno correspondiente a un carácter o letra. Aunque esto parezca más una novedad que una herramienta de OCR seria, no es imposible imaginar un dispositivo similar que pudiera escuchar la reproducción de esos tonos en orden y reconstituir las palabras en un nuevo medio. Dejando a un lado los avances tecnológicos, así es básicamente como funciona el OCR hoy en día.

Más grande y mejor

Goldberg continuó mejorando esta tecnología de OCR latente, y durante el período de entreguerras desarrolló una "máquina estadística". Este dispositivo fue, de hecho, el primer motor de búsqueda del mundo y utilizaba el OCR para buscar patrones específicos de caracteres en archivos de microfilm. Obtuvo una patente en EE. UU. para esta invención, que fue adquirida por el gigante informático IBM.

Ampliando el campo

Los primeros dispositivos de OCR tenían sus limitaciones, por supuesto. En concreto, solo eran capaces de reconocer texto perfecto; es decir, texto perfectamente recto, perfectamente claro e impreso en la única fuente que estos dispositivos estaban programados para reconocer. Las máquinas básicamente comparaban el carácter que escaneaban con una base de datos de caracteres para ver si encontraban una coincidencia. Dadas las limitaciones de la memoria de las computadoras, estas bases de datos eran necesariamente pequeñas y no ofrecían margen de maniobra a los usuarios. O la fuente coincidía exactamente, o el lector no la reconocía.

A medida que el poder de procesamiento de las computadoras aumentó en los años sesenta y setenta, los lectores OCR omni-font se convirtieron en la norma.Estos escáneres no buscaban una coincidencia exacta. En cambio, comenzaban a reconocer la forma general, a pesar de las diferencias en el diseño de la fuente.

Entrando en la era moderna

Los dispositivos OCR tal como los conocemos hoy en día comenzaron sin duda con Kurzweil Computer Products, Inc., fundada en 1974. Otro dispositivo omni-fuente, Kurzweil ideó una aplicación para el hardware que fue francamente revolucionaria. Su idea era desarrollar una máquina de lectura para ciegos, que permitiera a las personas con discapacidad visual leer un libro en voz alta mediante una computadora. Fue otro invento adelantado a su tiempo y, sin duda, fuera del presupuesto del público. Sin embargo, la máquina en sí no solo representó una seria innovación, sino que también produjo un par de tecnologías que se han convertido en parte integral de la mayoría de los sistemas OCR: el sintetizador de texto a voz y el escáner plano.

Un mundo electrónico en constante cambio

En el siglo XXI, el OCR alcanzó su máximo esplendor. Al combinarlo con la tecnología de internet, sus posibles aplicaciones se hicieron realidad. El reconocimiento de caracteres se amplió, abarcando la mayoría de las fuentes, y el escáner plano dio paso al dispositivo portátil. A medida que los algoritmos de reconocimiento se volvieron más sofisticados y los escáneres ópticos comenzaron a manejar resoluciones cada vez más altas, surgieron nuevos y emocionantes usos para la tecnología. ¿Alguna vez te has quedado atrapado en un país extranjero con letreros en un idioma que no entiendes? Ahora puedes simplemente tomar una foto, procesarla en una aplicación de OCR y esta reconocerá las palabras, el idioma y podrá traducirlo.

Este tipo de software de verificación instantánea ha revolucionado la forma en que operamos. Permite reconocer facturas y recibos, pasaportes, matrículas de vehículos, seguros y mucho más, y saber qué hacer con esa información.

Sitios como el Proyecto Gutenberg han utilizado la precisión mejorada de la tecnología OCR para escanear textos antiguos que actualmente son de dominio público, con el fin de producir versiones electrónicas precisas y completas de los clásicos, que se ofrecen gratuitamente. Google Libros fue un paso más allá, permitiendo a sus usuarios buscar palabras y frases dentro de la imagen escaneada original, no solo en los datos electrónicos.

Con tantos usos en todo el mundo, el OCR es una de esas tecnologías que casi todo el mundo utiliza, pero de la que nadie habla, y eso es una pena.

¿Hacia dónde vamos ahora?

El reconocimiento óptico de caracteres (OCR) ha recorrido un largo camino, desde el lector de libros musicales de 1914 hasta la infinidad de aplicaciones que utilizan esta tecnología hoy en día. En ScanMarker, nos esforzamos constantemente por mejorar la calidad y la funcionalidad de nuestros dispositivos OCR (ScanMarker y ScanMarker Air), manteniéndonos constantemente a la vanguardia del sector. ¿Por qué no formar parte de este proceso? Adquiera un ScanMarker hoy mismo y descubra cómo puede transformar su mundo.

Regresar al blog

Un breve historial de OCR: la tecnología dentro de su escaneo

Deja un comentario

País/región

Idioma