A brief history of OCR: the technology inside your ScanMarker

Una breve historia de OCR: la tecnología dentro de su ScanMarker

Tanto ScanMarker como ScanMarker Air son tipos de dispositivos OCR. Estas herramientas de productividad multifuncionales están a la vanguardia de la tecnología moderna y brindan una variedad de beneficios a personas de todo el mundo. Nos han contactado estudiantes que toman notas de estudio, abogados que preparan informes legales, médicos que transcriben expedientes de pacientes y una gran cantidad de periodistas, blogueros e historiadores que toman citas precisas de fuentes originales con su ScanMarker. Más que eso, hemos recibido el agradecimiento de personas con problemas de aprendizaje, personas con discapacidad visual, personas que están aprendiendo un idioma extranjero y padres de niños con necesidades educativas especiales por la ayuda que nuestro dispositivo les brinda en su día a día. vidas.

¿Pero como llegamos aquí? ¿Qué es la tecnología OCR y de dónde viene?

Una breve explicación

OCR es la abreviatura de reconocimiento óptico de caracteres. Describe el proceso de convertir texto físico (es decir, una página impresa de un libro, periódico o revista) en datos electrónicos. Luego, esos datos se pueden utilizar de diferentes maneras. ScanMarker, por ejemplo, convierte esos datos en audio para poder leerle el texto. También puede traducirlo a diferentes idiomas, copiarlo en documentos y mucho más. OCR es una combinación notable de visión por computadora, reconocimiento de patrones e inteligencia artificial. El dispositivo literalmente ve el texto a través de su escáner, reconoce las formas de letras individuales y luego comprende lo que esas formas significan como caracteres por derecho propio, así como en conjunto con las otras letras que las rodean.

Donde todo comenzo

Sorprendentemente, el OCR es un invento de antes de la guerra y por preguerra no estamos hablando de la Segunda Guerra Mundial, estamos hablando de la Gran Guerra, la Primera Guerra Mundial. Para algo que imaginamos que es una innovación moderna, el OCR Sus raíces se remontan a 1914. En ese año, dos hombres, Emanuel Goldberg y Edmund Fournier d'Albe, desarrollaron, de forma independiente, los primeros dispositivos OCR. Goldberg inventó una máquina capaz de leer caracteres y convertirlos en código telegráfico. Mientras tanto, d'Albe creó un dispositivo conocido como Optophone. Se trataba de un escáner de mano que se podía mover a través de una página de texto impreso, produciendo tonos distintos y separados, cada uno de los cuales correspondía a un determinado carácter o letra. Si bien esto suena más a una novedad que a una herramienta de OCR seria; No es imposible imaginar un dispositivo hermano que pudiera escuchar esos tonos reproducidos en orden y reconstituir las palabras en un nuevo medio. Dejando a un lado los avances tecnológicos, así es esencialmente como funciona el OCR en la actualidad.

Mas grande y mejor

Goldberg continuó mejorando esta tecnología OCR latente y pasó los años entre guerras desarrollando una "máquina estadística". Este dispositivo fue, de hecho, el primer motor de búsqueda del mundo y utilizaba OCR para buscar patrones particulares de caracteres en archivos de microfilmes. Se le concedió una patente en los EE. UU. para este invento, una patente que fue adquirida por carta nada menos que por el gigante informático IBM.

Ampliando el campo

Los primeros dispositivos OCR tenían sus limitaciones, por supuesto. Específicamente, solo eran capaces de reconocer texto perfecto, es decir, texto perfectamente recto, perfectamente claro e impreso en la única fuente que estos dispositivos estaban programados para reconocer. Básicamente, las máquinas comparaban el personaje que escaneaban con una base de datos de personajes para ver si podían encontrar una coincidencia. Dadas las limitaciones de la memoria de la computadora, estas bases de datos eran pequeñas por necesidad y no ofrecían margen de maniobra a los usuarios. O la fuente coincidía exactamente o el lector no pudo reconocerla.

A medida que la potencia de procesamiento de las computadoras aumentó en los años sesenta y setenta, los lectores OCR omnifuentes se convirtieron en la norma. Estos escáneres no buscaban una coincidencia exacta. En cambio, estaban empezando a reconocer la forma general, a pesar de las diferencias en el diseño de la fuente.

Entrando en la era moderna

Los dispositivos OCR tal como los conocemos hoy sin duda comenzaron con Kurzweil Computer Products, Inc, fundada en 1974. Otro dispositivo omni-fuente, Kurzweil ideó una aplicación para el hardware que fue francamente revolucionaria. Su idea era desarrollar una máquina de lectura para ciegos, una que permitiera a las personas con discapacidad visual leerles un libro en una computadora. Fue otro invento adelantado a su tiempo y ciertamente más allá del presupuesto del público que paga. Sin embargo, la máquina en sí no solo fue un pensamiento serio de próxima generación, sino que también produjo un par de tecnologías que se han convertido en una parte integral de la mayoría de los sistemas OCR. Se trataba del sintetizador de texto a voz y del escáner de superficie plana.

Un mundo electrónico en constante cambio

En el siglo XXI, el OCR realmente se hizo realidad. Al combinarlo con la tecnología de Internet, las posibles aplicaciones del OCR se hicieron realidad. El reconocimiento de caracteres se hizo más amplio, se tuvieron en cuenta la mayoría de las fuentes y el escáner de superficie plana dio paso al dispositivo portátil. A medida que los algoritmos de reconocimiento se volvieron más sofisticados y los escáneres ópticos comenzaron a manejar resoluciones cada vez más altas, surgieron nuevos e interesantes usos para la tecnología. ¿Alguna vez te has quedado atrapado en un país extranjero con carteles en un idioma que no entiendes? Ahora puede simplemente tomar una foto, procesarla en una aplicación OCR y ésta reconocerá las palabras, el idioma y podrá traducirla.

Este tipo de software de verificación instantánea ha revolucionado la forma en que hacemos negocios. Pueden reconocer facturas y recibos, pasaportes, matrículas de automóviles, documentos de seguros y mucho más, y luego saber qué hacer con esa información.

Sitios como el Proyecto Gutenberg han estado utilizando la precisión mejorada de la tecnología OCR para escanear textos antiguos que actualmente son de dominio público, con el fin de producir versiones electrónicas precisas y completas de los clásicos, que regalan. Google Books fue un paso más allá y permitió a sus usuarios buscar palabras y frases dentro de la imagen escaneada original, no solo en los datos electrónicos.

Con tantos usos en todo el mundo, el OCR es una de esas tecnologías que casi todo el mundo utiliza, pero de la que nadie habla, y eso es una pena.

¿Adónde vamos ahora?

Ha sido todo un viaje para el OCR, desde el dispositivo de lectura de libros musicales de 1914 hasta la infinidad de aplicaciones que utilizan la tecnología en la actualidad. Aquí en ScanMarker, siempre nos esforzamos por mejorar la calidad y la funcionalidad de nuestros propios dispositivos OCR (ScanMarker y ScanMarker Air), colocándonos constantemente a la vanguardia del campo. ¿Por qué no ser parte de ese viaje usted mismo? Adquiera un ScanMarker hoy y vea cómo puede cambiar su mundo.

Regresar al blog

Deja un comentario

Ten en cuenta que los comentarios deben aprobarse antes de que se publiquen.