Sowohl der ScanMarker als auch der ScanMarker Air sind OCR-Geräte. Diese multifunktionalen Produktivitätstools sind auf dem neuesten Stand der Technik und bieten Menschen weltweit zahlreiche Vorteile. Studierende, die Studiennotizen machen, Anwälte, die Schriftsätze erstellen, Ärzte, die Patientenakten transkribieren, und zahlreiche Journalisten, Blogger und Historiker, die mit ihrem ScanMarker präzise Zitate aus Originalquellen übernehmen, haben sich bei uns gemeldet. Darüber hinaus haben sich Menschen mit Lernschwierigkeiten, Sehbehinderungen, Fremdsprachenlernende und Eltern von Kindern mit sonderpädagogischem Förderbedarf für die Unterstützung unseres Geräts im Alltag bedankt.
Aber wie sind wir hierher gekommen? Was ist OCR-Technologie und woher kommt sie?
Eine kurze Erklärung
OCR steht für optische Zeichenerkennung. Es beschreibt den Prozess der Umwandlung von physischem Text – also einer gedruckten Seite in einem Buch, einer Zeitung oder einer Zeitschrift – in elektronische Daten. Diese Daten können dann auf vielfältige Weise genutzt werden. Der ScanMarker beispielsweise wandelt diese Daten in Audio um, um Ihnen den Text vorzulesen. Er kann ihn auch in verschiedene Sprachen übersetzen, in Dokumente kopieren und vieles mehr. OCR ist eine bemerkenswerte Kombination aus Computer Vision, Mustererkennung und künstlicher Intelligenz. Das Gerät sieht den Text buchstäblich durch seinen Scanner, erkennt die Formen einzelner Buchstaben und versteht dann, was diese Formen als Zeichen für sich und in Verbindung mit den anderen Buchstaben um sie herum bedeuten.
Wo alles begann
Überraschenderweise ist OCR eine Erfindung aus der Vorkriegszeit, und mit Vorkriegszeit meinen wir nicht den Zweiten Weltkrieg, sondern den Ersten Weltkrieg. Obwohl wir uns eine moderne Innovation vorstellen, reichen die Wurzeln von OCR bis ins Jahr 1914 zurück. In diesem Jahr entwickelten zwei Männer, Emanuel Goldberg und Edmund Fournier d'Albe, unabhängig voneinander die ersten OCR-Geräte. Goldberg erfand eine Maschine, die Zeichen lesen und in Telegrafencode umwandeln konnte. Unterdessen schuf d'Albe ein Gerät namens Optophon. Dabei handelte es sich um einen Handscanner, der über eine gedruckte Textseite geführt werden konnte und deutlich erkennbare Töne erzeugte, die jeweils einem bestimmten Zeichen oder Buchstaben entsprachen. Das klingt zwar eher nach einer Neuheit als nach einem ernstzunehmenden OCR-Tool, doch es ist nicht unmöglich, sich ein vergleichbares Gerät vorzustellen, das die Töne der Reihe nach hören und die Wörter in einem neuen Medium wiederherstellen konnte. Abgesehen vom technologischen Fortschritt funktioniert OCR heute im Wesentlichen so.
Größer und besser
Goldberg entwickelte die latente OCR-Technologie kontinuierlich weiter und verbrachte die Zwischenkriegsjahre mit der Entwicklung einer „Statistischen Maschine“. Dieses Gerät war praktisch die erste Suchmaschine der Welt und nutzte OCR, um Mikrofilmarchive nach bestimmten Zeichenmustern zu durchsuchen. Für diese Erfindung erhielt er in den USA ein Patent, das direkt vom Computergiganten IBM erworben wurde.
Erweiterung des Feldes
Frühe OCR-Geräte hatten natürlich ihre Grenzen. Insbesondere konnten sie nur perfekten Text erkennen – also Text, der absolut gerade, klar und in der Schriftart gedruckt war, auf deren Erkennung die Geräte programmiert waren. Die Maschinen verglichen die gescannten Zeichen im Wesentlichen mit einer Datenbank, um eine Übereinstimmung zu finden. Aufgrund der begrenzten Speicherkapazität von Computern waren diese Datenbanken zwangsläufig klein und boten den Benutzern keinen Spielraum. Entweder stimmte die Schriftart exakt überein, oder das Lesegerät erkannte sie nicht.
Mit der zunehmenden Rechenleistung von Computern in den 60er und 70er Jahren wurden OCR-Lesegeräte für alle Schriftarten zur Norm.Diese Scanner suchten nicht nach einer exakten Übereinstimmung. Stattdessen begannen sie, trotz der Unterschiede im Schriftdesign allgemeine Formen und Gestalten zu erkennen.
Eintritt in die Moderne
Die Erfindung von OCR-Geräten, wie wir sie heute kennen, begann zweifellos mit der 1974 gegründeten Kurzweil Computer Products, Inc. Kurzweil entwickelte für dieses ebenfalls Omnifont-fähige Gerät eine geradezu revolutionäre Anwendung. Seine Idee war die Entwicklung einer Lesemaschine für Blinde, die es Sehbehinderten ermöglichen sollte, sich Bücher von einem Computer vorlesen zu lassen. Auch diese Erfindung war ihrer Zeit voraus und für zahlende Leser sicherlich unerschwinglich. Doch nicht nur die Maschine selbst war bahnbrechendes Denken, sondern brachte auch zwei Technologien hervor, die heute fester Bestandteil der meisten OCR-Systeme sind: der Text-to-Speech-Synthesizer und der Flachbettscanner.
Eine sich ständig verändernde elektronische Welt
Im 21. Jahrhundert erlebte OCR seine wahre Blütezeit. Durch die Kombination mit Internettechnologie wurden die Anwendungsmöglichkeiten von OCR Realität. Die Zeichenerkennung wurde erweitert, die meisten Schriftarten wurden erfasst, und der Flachbettscanner wich dem Handgerät. Mit immer ausgefeilteren Erkennungsalgorithmen und immer höheren Auflösungen für optische Scanner eröffneten sich spannende neue Einsatzmöglichkeiten für die Technologie. Waren Sie schon einmal in einem fremden Land mit Schildern in einer Sprache festgefahren, die Sie nicht verstanden? Jetzt können Sie einfach ein Foto aufnehmen, es in einer OCR-App verarbeiten und diese erkennt die Wörter und die Sprache und kann sie Ihnen zurückübersetzen.
Diese Art von Software zur sofortigen Überprüfung hat unsere Geschäftsabläufe revolutioniert. Sie können Rechnungen und Quittungen, Reisepässe, Autokennzeichen, Versicherungsdokumente und vieles mehr erkennen und wissen dann, was mit diesen Informationen zu tun ist.
Websites wie Project Gutenberg nutzen die verbesserte Genauigkeit der OCR-Technologie, um alte, gemeinfreie Texte zu scannen und so präzise und vollständige elektronische Versionen der Klassiker zu erstellen, die sie kostenlos zur Verfügung stellen. Google Books geht noch einen Schritt weiter und ermöglicht seinen Nutzern die Suche nach Wörtern und Ausdrücken im gescannten Originalbild und nicht nur in den elektronischen Daten.
Obwohl OCR weltweit so vielseitig eingesetzt wird, ist es eine jener Technologien, die fast jeder nutzt, über die aber niemand spricht, und das ist schade.
Wohin als nächstes?
OCR hat eine lange Reise hinter sich, vom ersten Notenlesegerät von 1914 bis zu den unzähligen Anwendungen, die diese Technologie heute nutzen. Wir bei ScanMarker arbeiten ständig daran, die Qualität und Funktionalität unserer OCR-Geräte – des ScanMarker und des ScanMarker Air – zu verbessern und uns so stets an die Spitze der Branche zu setzen. Werden Sie selbst Teil dieser Reise! Holen Sie sich noch heute einen ScanMarker und erleben Sie, wie Sie Ihre Welt verändern können.