ABBYY FineReader Engine 9.0 for Linux > Wichtigste Funktionen

Bildverarbeitung

Nach Erhalt von Bildern kann FineReader Engine folgende Vorverarbeitungsprozesse durchführen, um die Qualität der Dokumentbilder zu verbessern für die weitere Erkennung und Archivierung:

Grundlegende Bildverarbeitungsfunktionen

FineReader Engine bietet eine Vielzahl von Bildverarbeitungsfunktionen für notwendige Bildmanipulationen wie:

  • Bildskalierung
  • Bildclipping
  • Vorschauen erstellen
  • Automatisch Ausrichtung gedrehter Bilder (90, 180 und 270 Grad)
  • Begradigung von Linien
  • Spiegelung und Invertierung

Automatische Begradigung von Textzeilen

Diese Funktion ist vor allem dann wichtig, wenn vom Scanner übermittelte Bilder eine Entzerrung des Bildes notwendig machen. Die Definition von Seitenrahmen oder –linien wird hierbei nicht benötigt. Für Formularverarbeitungssoftware ist die Berechnung der Schräglage auf Basis von Referenzblöcken möglich. FineReader Engine 9.0 bietet mehrere Methoden zur Entzerrung von Bildern: anhand von Paaren schwarzer Quadrate, Linien oder Textzeilen.

Teilung von Doppelseiten

Perfekt für das Einscannen von beiden Seiten eines geöffneten Buches. Die Erkennungsqualität ist höher, wenn nach dem Scannen die Seiten geteilt werden, sodass jede Seite einer Buchseite entspricht. Texterkennung und Layoutanalyse werden dann für jede Seite separat durchgeführt, ebenso die Begradigung, sofern notwendig.

Säubern von Bildern

Zur Reinigung von „Schmutz“ in Bildern. Das Bild könnte sehr viele Störungen enthalten, z.B. viele überschüssige Pixel aufweisen. Die Punkte treten auf bei Dokumenten mit mittlerer bis niedriger Qualität, und wenn sich diese in der Nähe von Zeichenrändern befinden, können sie einen negativen Einfluss auf die OCR-Erkennungsqualität haben. In diesen Fällen kann die Technologie zur Beseitigung von „Schmutz“ die Erkennungsqualität verbessern.

Adaptive Binarisierung und Entfernen von Texturen

Technologie zur Beseitigung von „Hintergrundauschen“ wie Farbe und Textur, was eine höhere Erkennungsgenauigkeit bei schwer lesbaren Dokumenten, wie z.B. Zeitungen, farbigen Dokumenten, Faxen und Kopien bewirkt. Die innovative Technologie der Adaptiven Binarisierung passt während der Erkennung die Schwellwerte der Helligkeit für jedes Bildfragment dynamisch an. Durch den Einsatz individueller Parameter werden Dokumente besser erkannt, deren Hintergrund und Textur in Graustufen, unterschiedlichen Farben oder unterschiedlichen Kontraststärken gehalten sind.

Automatische Ausrichtung gedrehter Bilder (um 90, 180, 270 Grad)

Dieses Feature ist besonders wichtig, wenn Dokumente über einen Automatischen Stapeleinzug eingespeist werden und nicht immer bekannt ist, mit welcher Ausrichtung das Blatt eingescannt wurde. Das Leseverfahren von FineReader erkennt automatisch die Ausrichtung der Seite und korrigiert sie, wenn nötig.

Ändern der Textfarbe und oder des Hintergrunds in den Erkennungsbereichen

Ein wichtiges Feature für Kunden, die mit Dokument-Management-Systemen arbeiten. Hier ein typisches Szenario für seine Anwendung: Ein bereits eingelesenes Bild ist im Archiv als Bild und als Volltext abgelegt worden. Das archivierte Inhaltsverzeichnis enthält zudem die Koordinaten jedes Zeichens auf der Seite. Startet man nun eine Archivsuche, so wird das Abbild des Dokumentes als Quelle des gesuchten Textes angezeigt. Mit Hilfe dieses Features von FineReader Engine ist der gesuchte Text farbig markiert und auch farbig unterlegt.

ABBYY OCR für Digitalfotos

Die neue Technologie unterscheidet zwischen Abbildern von Dokumenten, die mit der Digitalkamera aufgenommen und denen, die per Scanner erfasst wurden. Sie wendet bei der Verarbeitung jeweils unterschiedliche Algorithmen an und korrigiert die spezifischen Probleme, die bei Digitalbildern oft zu beobachten sind: ungenügende Belichtung, unscharfen Text, schiefe Textzeilen und fehlende Angaben zu Auflösung.

Säuberung des Bildes in bestimmten Textblöcken/Zonen

mit der Möglichkeit, den Schwellwert des Filters festzulegen.

Datenextrahierung von Feldern mit unterschiedlichen Rändern und Rahmen

wie z.B. Combobox, unterstrichene Felder, Kästen etc. FineReader Engine bietet ebenfalls eine Reihe von Funktionen für Bildvorverarbeitung, wie beispielsweise „Bild skalieren“, „Bild zuschneiden“, „Vorschau erstellen“, „Bild rotieren (90, 180, 270 Grad)“, „Zeilenbegradigung“, „Spiegeln“ und „Textinvertierung“.


Andere Funktionen von ABBYY FineReader Engine 9.0 for Linux:

Unterstützung der gängigsten Bildformate
Dokumenenanalyse
Rekonstruktion des Layouts
Sprachunterstützung
Barcodeerkennung
PDF-Umwandlung
Zusätzliche Entwickler-Tools
Output Optionen