/Pages/ProductsPage.aspx

Was ist OCR?

Was ist OCR?

Mal angenommen, Sie möchten einen Zeitungsartikel oder einen gedruckten Vertrag digitalisieren. Sie könnten Stunden mit Abtippen und Korrekturen der Tippfehler verbringen. Oder Sie könnten alle benötigten Unterlagen mittels Scanner (oder Digitalkamera) und Optical Character Recognition Technologie innerhalb weniger Minuten ins digitale Format umwandeln.

Was genau heißt OCR?

Optical Character Recognition (Optische Zeichenerkennung), oder kurz OCR, ist eine Technologie, die die Umwandlung unterschiedlicher Dokumente, wie beispielsweise gescannter Papierdokumente, PDF-Dateien oder Digitalbilder in editierbare und durchsuchbare Daten ermöglicht.

Stellen Sie sich vor, Sie haben ein Dokument in Papierform – zum Beispiel einen Zeitungsartikel, eine Broschüre oder einen Vertrag, den Ihnen Ihr Partner als PDF-Anhang geschickt hat. Offensichtlich reicht ein Scanner nicht aus, um die relevanten Informationen aus diesen Dokumenten herauszuziehen und beispielsweise im bearbeitbaren Microsoft Word-Format wiederzugeben. Alles, was ein Scanner leisten kann, ist ein Bild des Dokuments zu erstellen. Und dieses ist lediglich eine Ansammlung schwarzer, weißer oder farbiger Bildpunkte, die tabellarisch angeordnet und in der Fachsprache unter dem Begriff Rastergrafik bekannt sind. Zum Auslesen und Weiterverwenden der Informationen aus gescannten Dokumenten, Digitalbildern oder Nur-Bild-PDFs benötigt man eine OCR-Software, die in den Bildern Buchstaben erkennt, diese zu Wörtern zusammensetzt und aus diesen wiederum ganze Sätze baut. Damit ermöglicht Ihnen die Software den Zugang zum eigentlichen Inhalt der Dokumente, den Sie anschließend weiter bearbeiten können.

Welche Technologie "steckt" hinter OCR?

Welche Mechanismen genau den Menschen die Erkennung von Objekten ermöglichen, ist noch nicht bis ins Letzte erforscht, doch die drei Grunderkennungsprinzipien sind Wissenschaftlern wohl bekannt - Einheit, Zweckmäßigkeit und Anpassungsfähigkeit (Integrity, Purposefulness und Adaptability, kurz (IPA)*. Auf diesen Kernprinzipien basiert auch die ABBYY FineReader OCR und imitiert so die menschliche Art, Objekte zu erkennen.

Lassen Sie uns zunächst einen Blick darauf werfen, wie FineReader OCR Text erkennt. Als Erstes analysiert das Programm die Struktur der Dokumentabbildung. Es unterteilt eine Seite in Elemente wie Textblöcke, Tabellen, Bilder usw. Anschließend werden Zeilen in Wörter und schließlich Wörter in Buchstaben aufgeteilt. Wurden erstmal die einzelnen Buchstaben ausgemacht, vergleicht das Programm diese mit einer Reihe von Musterbildern und stellt zahlreiche Hypothesen auf, um welchen Buchstaben es sich hierbei handelt. Basierend auf diesen Hypothesen untersucht das Programm die unterschiedlichen Arten, auf welche Linien in Wörter und Wörter in Buchstaben aufgeteilt werden können. Nach Verarbeitung einer sehr großen Anzahl solcher Wahrscheinlichkeitshypothesen trifft das Programm schließlich eine Entscheidung und präsentiert den erkannten Text.

Zusätzlich bietet ABBYY FineReader Express Edition for Mac Wörterbuchunterstützung für 36 Sprachen. Dies erlaubt eine Sekundäranalyse der Textelemente auf Wortebene. Mit Wörterbuchunterstützung gewährleistet das Programm eine noch genauerer Analyse und Dokumenterkennung und vereinfacht zudem die Verifizierung der Erkennungsergebnisse.

Auf welchem Prinzip basiert FineReader OCR? Die am weitesten entwickelten und damit fortschrittlichsten Systeme zur Texterkennung, wie auch ABBYY FineReader OCR, zielen auf die Imitation der Erkennung von Objekten, wie sie in der Natur oder auch bei Tieren vorkommt. Im Kern basieren diese Systeme auf den drei Grundprinzipien Einheit, Zweckmäßigkeit und Anpassungsfähigkeit. Das Prinzip der Einheit besagt, dass das beobachtete Objekt immer als ein aus vielen miteinander verbundenen Einzelteilen bestehendes „Ganzes“ betrachtet werden muss. Das Prinzip der Zweckmäßigkeit setzt voraus, dass jede Interpretation von Daten stets einem bestimmten Zweck dienen muss. Und das Prinzip der Anpassungsfähigkeit schließlich bedeutet, dass das Programm fähig sein muss, zu lernen.

Man muss kein OCR-Spezialist sein, um die Vorteile einer OCR-Applikation zu erkennen, die auf den IPA-Prinzipien aufgebaut ist. Auf Basis dieser Prinzipien wendet das Programm eine äußert flexible und intelligente Erkennungsmethode an, die der menschlichen Art, Objekte zu erkennen, sehr nahe kommt.

Nach jahrelanger Forschung ist es ABBYY gelungen, die oben beschriebenen IPA-Prinzipien in seine OCR-Technologie zu integrieren.