ABBYY FineReader Engine 10 for Windows > OCR Schritte

OCR, ICR und andere Erkennungstechnologien

 

Optical Character Recognition (OCR)

  • OCR Technologie — die Erkennung von gedrucktem Text ist verfügbar in 198 Sprachen, darunter:
    • Europäische Sprachen (lateinische, kyrillische, armenische, griechische Zeichensätze) 
    • Chinesisch (Vereinfacht und Traditionell), Japanisch und Koreanisch (CJK) 
    • Thai, Vietnamesisch und Hebräisch
    • Arabisch — technische Preview-Version 
    • FineReader XIX — ein OCR-Modul welches speziell für die Digitalisierung und Archivierung von alten Dokumenten, Büchern und Zeitungen entwickelt wurde, die im 17. bis 20. Jahrhundert entstanden sind. Viele dieser Dokumente sind selten und werden in Bibliotheken und von staatlichen Institutionen archiviert, um sie für die Nachwelt zu erhalten. FineReader XIX bietet die Möglichkeit, Texte zu erkennen, die in den Jahren 1600 bis 1937 in Englisch, Französisch, Deutsch, Italienisch und Spanisch entstanden sind. Das Produkt unterstützt die Erkennung der Schriften Fraktur, Schwabacher und der meisten gotischen Schriften. 
  • Für 47 Sprachen gibt es Wörterbuch/Morphologie-Unterstützung, was deutlich die OCR-Genauigkeit erhöht.
  • Funktionen zur Erkennung mehrseitiger Dokumente ermöglichen das Auslesen von Texten in den mehrere Sprachen vorkommen, beispielsweise Deutsch und Chinesisch oder auch Englisch, Russisch und Koreanisch in ein und dem gleichen Dokument 
  • Erkennung von Dokumenten, die mit Punkt-Matrix-Druckern erstellt wurden — ABBYY FineReader Engine erkennt viele verschiedene Textarten, die mit Punkt-Matrix-Druckern erstellt wurden. Die Technologie wurde verfeinert, indem Tausende Textproben von verschiedenen Druckern verarbeitet wurden: Punkt-Matrix-Drucker, Typenraddrucker, Kettenraddrucker und Banddrucker, und dies unter Nutzung unterschiedlicher Druckqualitäten - von Entwurf bis höchste Qualität.  
  • Erkennung von Dokumenten, die mit Schreibmaschine erstellt wurden.
  • Erkennung von OCR-A, OCR-B, MICR (E13B) und CMC7 Schriften.  

 Siehe die Liste der Erkennungssprachen

Intelligent Character Recognition (ICR)

  • ICR Technologie für über 113 Sprachen
  • Etwa 30 Sprachen (mit lateinischem, griechischem und kyrillischem Zeichensatz) mit Morphologie/Wörterbuch-Unterstützung. 
  • Etwa 85 Sprachen mit lateinischem Alphabet ohne Wörterbuchunterstützung.  
  • ICR für Indische Ziffern, wie sie in arabischen Ländern verwendet werden.
  • Unterstützung von 22 verschiedenen Handschriftarten unterschiedlicher Länder und Regionen: Europa, Amerika, Kanada, Russland, Japan, Arabische Länder und Thai.
  • Erkennung von Handschrift in Feldern und Rahmen - unterstrichene Felder, Kästen, Kamm-Felder, etc. 
  • Mehrsprachige ICR. Einer der wichtigsten Vorteile der ABBYY ICR Technologie ist die gleichbleibende Erkennungsqualität bei der Erkennung von Ziffern sowie von Ziffern in Kombination mit einer oder mehreren Sprahcen, und dies auch wenn die Felder klein und groß geschriebene Buchstaben enthalten.

Auswahlfelder (OMR)

ABBYYs OMR Technologie erkennt einfache und gruppierte Auswahlfelder, Model Checkmarks, und Auswahlfelder, die von Hand "korrigiert" wurden.

OMR bietet eine Erkennungsgenauigkeit von 99.995 %

Barcode-Erkennung (OBR)

  • 1D und 2D Barcodes. ABBYY OCR SDK unterstützt die Erkennung häufig genutzter 1D und 2D Barcodes. Siehe Liste der unterstützten Barcodes
  • Schnelle Extrahierung von Barcodes. Diese Funktion ermöglicht die automatisierte Identifikation und Erkennung von Barcodes auf einem Dokument, unabhängig wo es sich auf der Seite befindet.

Erkennungsmodi

Mit den voreingestellten Verarbeitungsmodi in FineReader Engine können Entwickler schnell und einfach das richtige Verhältnis hinsichtlich Geschwindigkeit und Genauigkeit für ihr jeweiliges Projekt einstellen. Zusätzlich zum Default Verarbeitungsmodus können OCR und ICR in den drei Modi "Normal", "Fast Mode" und "Balanced Mode" ausgeführt werden. 

  • Erkennung im Normal Modus
    Dies ist der genaueste Modus, um die höchsten Erkennungsergebnisse zu erzielen. Dieser Modus wird empfohlen, wenn Sie den gewonnenen Inhalt der Dokumente weiterverwenden möchten oder wenn Genauigkeit der entscheidende Faktor in Ihrem Projekt ist.
  • Fast-Mode-Erkennung
    Entwickelt für Applikationen zur Verarbeitung einer großen Anzahl an Dokumenten, wobei Schnelligkeit wichtiger ist als Genauigkeit. Dieses Verfahren erhöht die Erkennungsgeschwindigkeit um 200 bis 250 Prozent und ist somit besonders nützlich für Dokumentmanagement- und Archivierungssysteme.
  • Erkennung im Balanced Mode
    Der Balanced Mode bietet die ideale Balance zwischen Erkennungsgeschwindigkeit und -genauigkeit. Mit den in FineReader Engine vordefinierten Verarbeitungsmodi können Entwickler schnell das für ihr Projekt optimale Verhältnis zwischen Qualität und Geschwindigkeit zu finden.

Volltext- und Field Level/Zonal -Erkennung

Es gibt zwei Arten der Erkennung: Erkennung von Volltext und Fleid Level/Zonal Erkennung. Der Hauptunterschied ist der, dass Volltexterkennung normalerweise OCR-Technologie nutzt und für Dokumentenkonvertierung verwendet wird. Field Level/Zonal Erkennung hingegen beinhaltet OCR, ICR und andere Technologien und wird zumeist für das Extrahieren bestimmter Daten aus bestimmten Bereichen des Dokumentes verwendet.  

Die folgende Tabelle zeigt die Spezifikationen der zwei Erkennungsarten:

 

 

Spezifikation

 

Volltext-Erkennung

 

Field Level/Zonal Erkennung

Anwendungsszenario Dokumentenkonvertierung, Archivierung von Büchern Data Capture (Datenerfassung)
Dokumentenanalyse Allgemeine DA, DA für Rechnungen, DA für Volltext-Indexierung Manuelle Spezifizierung der Blöcke für Field Level-Erkennung
Erkennung OCR mit einer allgemeinen Genaugkeit von etwa 96-99% OCR, ICR, Erkennung von Auswahlfeldern (OMR,) Barcode-Erkennung mit vordefinierten Datentypen und möglichen Werten. Genauigkeit von etwa 100%
Verifizierung Empfohlen, falls Inhalt weiterverwendet werden soll  In den meisten Fällen obligatorisch
Synthese Angewendet für das Wiederfinden von Dokumenten  Nicht angewendet
Export der Erkennungsergebnisse Dokumentdateien (RTF, DOC, PDF, etc.) Export zu XML-Datei oder Datenbank

 

Volltext-Erkennung

Volltext-Erkennung ist die Grunderkennungsart für unterschiedliche Aufgaben, z.B.

  • Konvertierung von Dokumenten und Büchern für Archivierung
  • Dokumentenkonvertierung zur Weiterverwendung des Inhalts 
  • Grundsätzliche Extrahierung von Text zur Identifikation von Feldern und Dokumentenklassifizierung 

Erfahren Sie mehr über Erkennungsaufgaben und Profile >>

All diese Aufgaben machen die Erkennung des gesamten Textes auf dem Dokument/der Dokumentseite notwendig. Vor der Erkennung wird normalerweise Dokumentenanalyse durchgeführt, die die folgenden Schritte ausführt: Trennung von Doppelseiten, Korrektur der Seitenorientierung (Drehung), Identifikation von Textblöcken, Bildern und anderen Elementen.

Nach der Erkennung rekonstruiert die Dokumentensynthese die Struktur und das Layout des Dokuments (für spätere Weiterverwendung des Inhalts) oder gibt lediglich die korrekte Textreihenfolge bei komplex aufgebauten Dokumenten mit mehreren Spalten und Bildern wieder (für Archivierung). Der erkannte Text wird je nach Aufgabe als reiner Text oder als ein Dokument in einem definierten Dateiformat ausgegeben.

Der Text kann manuell verifiziert werden, um seine Genauigkeit zusätzlich zu erhöhen. 

Field Level/Zonal Erkennung

ABBYY FineReader Engine 10 bietet umfassende Funktionalitäten für Field Level/Zonal Erkennung für die Ausführung wichtiger Geschäftsprozesse wie Formularverarbeitung sowie Klassifizierung und Indexierung von Schlüsselwörtern. Leistungsstarke Funktionen zur Verarbeitung von Bildern steigern zudem die Fähigkeit, auch kleine Bereiche richtig auszulesen, auch wenn sie grafische Elemente enthalten, die die Erkennung stören können (z. B. unterstrichener Text, durch Scannen entstandene Bildstörungen, etc.)  

Field Level/Zonal Erkennung bietet mehrsprachige OCR und ICR, Auswahlfelder-Erkennung (OMR), Erkennung von Barcodes und eine Reihe spezifischer Funktionen wie:

  • Datenextrahierung aus Feldern mit unterschiedlichen Begrenzungen und Rahmen, wie unterstrichene Felder, Kästchen und sogar Felder in denen der Text auch außerhalb der Begrenzungen ist
  • Definition des Feldinhalts durch Festlegen von Zeichensätzen, Wörterbüchern, regulären Ausdrücken, Arten der Segmentierung, Handschriftstilen, etc.  
  • Erkennung von Zeichenabständen innerhalb eines Feldes, genaue Erkennung von Feldern, in denene Leerzeichen zugelassen sind. ABBYY FineReader Engine 10 erlaubt zudem die Nutzung von Wörterbüchern, die Kombinationen aus Wörtern und Leerzeichen enthalten.
  • Intelligente Verarbeitung von Blöcken mit unterbrechenden Teilen und Linien, bietet die Erkennung von Text (Wörtern und Symbolen), der innerhalb der Blockbegrenzungen enthalten ist und verschwendet keine Zeit für die ERkennung von nicht relevanten Blöcken 
  • "Säubern" von Textblöcken, mit der Möglichkeit, die Größe der weißen oder schwarzen "Verschmutzungen" zu definieren   

Field Level/Zonal Erkennung wird von den spezifischen Tools für Entwickler unterstützt, wie Voting API und "On-the-Fly" Tuning. Details finden Sie unter Verbesserte Entwickler-Tools

Benutzersprachen

FineReader Engine bietet eine API, um eigene Erkennungssprachen zu erstellen und zu bearbeiten, Systemerkennungssprachen zu kopieren und anzupassen, sowie neue Wörter in vorhandene Benutzersprachen einzufügen.

Hier finden Sie zwei Beispiele, bei denen eigene Benutzersprachen helfen, die Erkennungsgenauigkeit zu erhöhen.

  • In per Hand ausgefüllten Dokumenten gehören die Angaben in den einzelnen Feldern normalerweise zu einer spezifischen Überschrift, wie z.B. Stadt, Land, PLZ, Artikelnummer, Summe etc. Um die Qualität des ICR Erkennung zu steigern können Sie eigene Benutzersprachen verwenden, um die Information zu definieren, die jedes Feld beinhalten könnte.
  • Wenn ein Dokument "logische" Strukturen beinhaltet, wie z.B. Artikelnummern, Telefonnummern, Passnummern etc., können Erkennungsfehler auftreten. Das liegt daran, dass das Programm diese Daten Zeichen für Zeichen liest. Um die Erkennungsqualität solcher Angaben zu verbessern, können Sie eine neue Erkennungssprache erstellen, mit deren Hilfe das Programm diese spezifischen Informationen korrekt erkennen wird.

Muster Training

In den meisten Fällen kann FineReader Engine Texte auch ohne vorheriges Training erfolgreich auslesen. Bei der Erkennung von dekorativen Schriften und Schriften mit Umriss, oder wenn eine große Menge von Texten in niedriger Druckqualität eingelesen werden soll, hat sich jedoch vorheriges Training des Programms an Mustern bewährt.

FineReader Engine bietet die Möglichkeit, Benutzermuster zu erstellen und anzuwenden oder diese von den ABBYY FineReader Desktop Applikationen (Professional oder Corporate Edition) zu importieren.

FineReader Engine ist flexibel und einsetzbar. Sie können eigene Anwendungen mit flexibler Architektur erstellen, von einer entwickelte Einzelplatz-Anwendung bis hin zu einer skalierbaren, serverbasierten Lösung.


Alle OCR Schritte:

Dokumenteingabe
Bildvorverarbeitung
Dokumentanalyse
Erkennung
Ausgabe und Export von erkanntem Text