Sia ScanMarker che ScanMarker Air sono dispositivi OCR. Questi strumenti di produttività multifunzionali sono all'avanguardia della tecnologia moderna e offrono una serie di vantaggi a persone in tutto il mondo. Siamo stati contattati da studenti che prendono appunti di studio, avvocati che preparano memorie legali, medici che trascrivono cartelle cliniche e una miriade di giornalisti, blogger e storici che estraggono citazioni accurate da fonti originali con il loro ScanMarker. Inoltre, abbiamo ricevuto ringraziamenti da persone con disabilità di apprendimento, ipovedenti, persone che stanno imparando una lingua straniera e genitori di bambini con bisogni educativi speciali per l'assistenza che il nostro dispositivo fornisce nella loro vita quotidiana.
Ma come siamo arrivati fin qui? Cos'è la tecnologia OCR e da dove nasce?
Una breve spiegazione
OCR è l'abbreviazione di riconoscimento ottico dei caratteri. Descrive il processo di conversione di testo fisico, ovvero una pagina stampata di un libro, di un giornale o di una rivista, in dati elettronici. Questi dati possono quindi essere utilizzati in diversi modi. ScanMarker, ad esempio, converte questi dati in audio in modo da poter rileggere il testo. Può anche tradurlo in diverse lingue, copiarlo in documenti e molto altro ancora. L'OCR è una straordinaria combinazione di visione artificiale, riconoscimento di pattern e intelligenza artificiale. Il dispositivo vede letteralmente il testo attraverso il suo scanner, riconosce le forme delle singole lettere e quindi ne comprende il significato come caratteri singoli, nonché in combinazione con le altre lettere circostanti.
Dove tutto ebbe inizio
Sorprendentemente, l'OCR è un'invenzione prebellica e con "prebellica" non ci riferiamo alla Seconda Guerra Mondiale, ma alla Grande Guerra, la Prima Guerra Mondiale. Per qualcosa che immaginiamo essere un'innovazione moderna, le radici dell'OCR risalgono addirittura al 1914. In quell'anno due uomini, Emanuel Goldberg ed Edmund Fournier d'Albe, svilupparono, indipendentemente l'uno dall'altro, i primi dispositivi OCR. Goldberg inventò una macchina in grado di leggere i caratteri e convertirli in codice telegrafico. Nel frattempo, d'Albe creò un dispositivo noto come Optofono. Si trattava di uno scanner portatile che poteva essere spostato su una pagina di testo stampato, producendo toni distinti e separati, ognuno dei quali corrispondeva a un determinato carattere o lettera. Sebbene questa possa sembrare più una novità che un vero e proprio strumento OCR, non è impossibile immaginare un dispositivo gemello in grado di ascoltare quei toni riprodotti in ordine e di ricostituire le parole in un nuovo supporto. A parte i progressi tecnologici, è essenzialmente così che funziona l'OCR oggi.
Più grande e migliore
Goldberg continuò a migliorare questa tecnologia OCR latente, dedicando gli anni tra le due guerre allo sviluppo di una "Macchina Statistica". Questo dispositivo fu, di fatto, il primo motore di ricerca al mondo e utilizzava l'OCR per ricercare particolari schemi di caratteri negli archivi di microfilm. Ottenne un brevetto negli Stati Uniti per questa invenzione, un brevetto che fu acquisito nientemeno che dal gigante informatico IBM.
Ampliare il campo
I primi dispositivi OCR avevano ovviamente i loro limiti. In particolare, erano in grado di riconoscere solo testo perfetto, ovvero testo perfettamente dritto, perfettamente chiaro e stampato nell'unico font per cui erano programmati. Le macchine sostanzialmente confrontavano il carattere scansionato con un database di caratteri per vedere se riuscivano a trovare una corrispondenza. Date le limitazioni della memoria dei computer, questi database erano necessariamente piccoli e non offrivano alcun margine di manovra agli utenti. O il font corrispondeva esattamente, o il lettore non riusciva a riconoscerlo.
Con l'aumento della potenza di elaborazione dei computer negli anni Sessanta e Settanta, i lettori OCR omni-font divennero la norma.Questi scanner non cercavano una corrispondenza esatta. Piuttosto, stavano iniziando a riconoscere la forma e la struttura generale, nonostante le differenze nel design dei caratteri.
Entrando nell'era moderna
I dispositivi OCR come li conosciamo oggi hanno avuto origine senza dubbio dalla Kurzweil Computer Products, Inc., fondata nel 1974. Kurzweil, altro dispositivo omni-font, inventò un'applicazione per l'hardware che era francamente rivoluzionaria. La sua idea era quella di sviluppare un dispositivo di lettura per non vedenti, che permettesse agli ipovedenti di farsi leggere un libro da un computer. Fu un'altra invenzione all'avanguardia per i suoi tempi e certamente al di là delle possibilità economiche del pubblico pagante. Tuttavia, non solo il dispositivo in sé rappresentava un'idea di nuova generazione, ma produsse anche due tecnologie che sono diventate parte integrante della maggior parte dei sistemi OCR: il sintetizzatore vocale e lo scanner piano.
Un mondo elettronico in continua evoluzione
Nel XXI secolo, l'OCR ha davvero raggiunto la sua massima espressione. Associandolo alla tecnologia Internet, le sue possibili applicazioni sono diventate realtà. Il riconoscimento dei caratteri è diventato più ampio, con la maggior parte dei font supportati, e lo scanner piano ha ceduto il passo ai dispositivi portatili. Con il progressivo perfezionamento degli algoritmi di riconoscimento e la capacità degli scanner ottici di gestire risoluzioni sempre più elevate, si sono aperti nuovi entusiasmanti utilizzi per questa tecnologia. Vi è mai capitato di essere bloccati in un paese straniero con cartelli in una lingua che non capivate? Ora basta scattare una foto, elaborarla in un'app OCR che riconoscerà le parole, la lingua e sarà in grado di tradurvela.
Questo tipo di software di verifica istantanea ha rivoluzionato il nostro modo di fare business. È in grado di riconoscere fatture e ricevute, passaporti, targhe automobilistiche, documenti assicurativi e molto altro ancora, e di sapere come utilizzare tali informazioni.
Siti come Project Gutenberg sfruttano la precisione migliorata della tecnologia OCR per scansionare testi antichi attualmente di pubblico dominio, al fine di produrre versioni elettroniche accurate e complete dei classici, che vengono poi distribuite gratuitamente. Google Libri ha fatto un ulteriore passo avanti, consentendo ai suoi utenti di cercare parole e frasi all'interno dell'immagine originale scansionata, non solo nei dati elettronici.
Con così tanti utilizzi in tutto il mondo, l'OCR è una di quelle tecnologie che quasi tutti usano, ma di cui nessuno parla, e questo è un peccato.
Dove andiamo adesso?
È stato un lungo viaggio per l'OCR, dal dispositivo per la lettura di libri musicali del 1914 alla miriade di applicazioni che utilizzano questa tecnologia oggi. Noi di ScanMarker ci impegniamo costantemente a migliorare la qualità e la funzionalità dei nostri dispositivi OCR – ScanMarker e ScanMarker Air – ponendoci costantemente all'avanguardia nel settore. Perché non partecipare anche tu a questo viaggio? Acquista oggi stesso uno ScanMarker e scopri come puoi cambiare il tuo mondo.