< zurück
ABBYY FineReader Engine 8.0 for Mac
Bearbeitung und Vorverarbeitung von Bildern
ABBYY FineReader Engine kann auf zwei Arten Bilder empfangen: direkt aus dem Speicher oder durch das Öffnen von Dateien. Unterstützt werden die meisten Bildformate, einschließlich mehrseitigen TIFFs und JPEG 2000 (Teil 1) sowie die Farbräume Schwarz-Weiß, Graustufen und RGB-Farben. ABBYY FineReader Engine kann auch PDFs öffnen.
FineReader Engine kann auch originale und modifizierte Bilder in verschiedenen Formaten abspeichern. Eine komplette Liste der Ein- und Ausgabeformate für Bilder finden Sie unter Spezifikationen.
Nach Erhalt der Bilder kann FineReader Engine folgende Vorverarbeitungsprozesse durchführen, um die Erkennung zu verbessern:
- Automatische Begradigung von Textzeilen
Diese Funktion ist vor allem dann wichtig, wenn vom Scanner übermittelte Bilder eine Entzerrung des Bildes notwendig machen. Die Definition von Seitenrahmen oder –linien wird hierbei nicht benötigt.
- Teilung von Doppelseiten
Perfekt für das Einscannen von beiden Seiten eines geöffneten Buches. Die Erkennungsqualität ist höher, wenn nach dem Scannen die Seiten geteilt werden, sodass jede Seite einer Buchseite entspricht. Texterkennung und Layoutanalyse werden dann für jede Seite separat durchgeführt, ebenso die Begradigung, sofern notwendig.
- Säubern von Bildern
Zur Reinigung von „Schmutz“ in Bildern. Das Bild könnte sehr viele Störungen enthalten, z.B. viele überschüssige Pixel aufweisen. Die Punkte treten auf bei Dokumenten mit mittlerer bis niedriger Qualität, und wenn sich diese in der Nähe von Zeichenrändern befinden, können sie einen negativen Einfluss auf die OCR-Erkennungsqualität haben. In diesen Fällen kann die Technologie zur Beseitigung von „Schmutz“ die Erkennungsqualität verbessern.
- Adaptive Binarisierung und Entfernen von Texturen
Technologie zur Beseitigung von „Hintergrundrauschen“ wie Farbe und Textur, was eine höhere Erkennungsgenauigkeit bei schwer lesbaren Dokumenten, wie z.B. Zeitungen, farbigen Dokumenten, Faxen und Kopien bewirkt.

Die innovative Technologie der Adaptiven Binarisierung passt während der Erkennung die Schwellwerte der Helligkeit für jedes Bildfragment dynamisch an. Durch den Einsatz individueller Parameter werden Dokumente besser erkannt, deren Hintergrund und Textur in Graustufen, unterschiedlichen Farben oder unterschiedlichen Kontraststärken gehalten sind.
- Automatische Ausrichtung gedrehter Bilder (um 90, 180, 270 Grad)
Dieses Feature ist besonders wichtig, wenn nicht bekannt ist, mit welcher Ausrichtung ein Blatt eingescannt wurde. Das Leseverfahren von FineReader erkennt automatisch die Ausrichtung der Seite und korrigiert sie, wenn nötig.
- Spezielle Vorverarbeitung von Digitalbildern. Die neue Technologie wendet bei der Verarbeitung unterschiedliche Algorithmen an und korrigiert die spezifische Bildverzerrung, die bei Digitalbildern oft zu beobachten ist. Durchschnittlich führt das zu 40 Prozent genaueren Ergebnissen bei der OCR für Digitalkameras.
- Säuberung des Bildes in bestimmten Textblöcken/Zonen, mit der Möglichkeit, den Schwellwert des Filters festzulegen.
FineReader Engine bietet ebenfalls eine Reihe nützlicher Funktionen zur Vorverarbeitung von Bildern, wie beispielsweise „Bild skalieren", „Bild zuschneiden", „Vorschau erstellen", „Rotieren (90, 180, 270 Grad), „Bild spiegeln" und „Bild invertieren".
Dokumentenanalyse und vollständige Layoutübernahme

Die Dokumentenanalysefunktionen von FineReader Engine API lösen Aufgaben wie z.B. die automatische Dokumentenumwandlung mit kompletter Layoutübernahme sowie OCR nach Zonen mit manuell definierten Blöcken. Das beinhaltet:
- Automatische Seitenausrichtung - 90, 180, 270 Grad;
- Automatische Erkennung von Textblöcken, Tabellen, Barcodes und Bildern;
- Automatische Erkennung von vertikalem Text in Tabellenzellen;
- Manuelle Bearbeitung von Blöcken (Hinzufügen, Entfernen und Editieren);
Die einzigartigen Features von FineReader Engine sind:
- Dokumentenanalyse zur Archivierung
Diese Funktion erkennt und erfasst automatisch den gesamten Text eines Dokuments einschließlich des Textes, der auf Bildern, in Tabellen und Diagrammen platziert ist. Entwickler können diesen Modus der Dokumentanalyse wählen, um die vollständige Information aus Dokumenten zu erhalten, die für die Indizierung benötigt wird (beispielsweise in DMS-, CMS- und Archivsystemen).
- Dokumentenanalyse für Rechnungen
Eine besondere Dokumentenanalyse für die Vorverarbeitung von semi-strukturierten Dokumenten wie z.B. Rechnungen, Kontoauszügen, Schecks, Überweisungen, Visitenkarten, Verträgen, Krankenversicherungsanträgen, Lebensläufen etc. Während der Bildanalyse versucht die Software, so viel Text auf den Dokumenten zu finden wie möglich, inklusive Zeichen und Ziffern – und dies sogar dann, wenn sich die Information innerhalb von Stempeln, Bildern, Logos oder kleinen Textblöcken befindet. Anders als bei der standardmäßigen ganzseitigen Dokumentenanalyse geht diese besondere Dokumentenanalyse davon aus, dass jede Information auf dem Dokument relevanter Text ist. Sie garantiert auch, dass wichtige Textinformationen nicht als grafische Elemente eingestuft werden und keine Aufteilung von Wörtern oder Zahlen in mehrere einzelne Zeichen erfolgt. Das Ergebnis ist ein Maximum an Informationen über den Text inklusive der Koordinaten der jeweiligen Daten. Diese Informationen können für weitere Analyse, Bearbeitung von Feld zu Feld sowie Syntaxanalyse bei weiteren Verarbeitungsschritten auf anderen Systemen verwendet werden.
- Export in verschiedene Formate, darunter PDF, RTF/DOC/WordML, XML und HTML, mit vollständiger Layoutübernahme.
Erkennung

OCR
- OCR für 175 Sprachen.
- 170 Sprachen mit lateinischen, kyrillischen, griechischen, hebräischen und armenischen Buchstaben.
- 43 Sprachen mit Wörterbuch/Morphologie-Unterstützung.
- Erkennung von mehrsprachigen Dokumenten.
- Erkennung von Dokumenten aus Matrixdruckern.
- Erkennung von Schreibmaschinenschriften.
- Fast Mode Erkennung
Entwickelt für Applikationen zur Verarbeitung einer großen Anzahl an Dokumenten, wobei Schnelligkeit wichtiger ist als Genauigkeit. Dieses Verfahren erhöht die Erkennungsgeschwindigkeit um 200 bis 250 Prozent und ist somit besonders nützlich für Dokumentmanagement- und Archivierungssysteme.
- Erkennung von OCR-A, OCR-B.
- FineReader XIX
Es existieren viele alte Dokumente, Bücher und Zeitungen, die im 17. bis 20. Jahrhundert auf der ganzen Welt veröffentlicht worden sind. Eine Reihe zusätzlicher Funktionen von ABBYY FineReader Engine, genannt “FineReader XIX” bietet die EINZIGARTIGE Möglichkeit, Texte einzulesen, die im Zeitraum 1600 bis 1937 auf Englisch, Französisch, Deutsch, Italienisch und Spanisch gedruckt worden sind. FineReader XIX unterstützt spezielle Schriftarten wie Fraktur, Schwabacher und die meisten gotischen Schriftarten.
Die komplette Liste unterstützter Sprachen für OCR/ICR finden Sie unter Technische Spezifikationen.
Barcode-Erkennung
- Erkennung von 1D Barcodes
FineReader Engine unterstützt die gebräuchlichsten 1D Barcodes: Code 39, Checked Code 39, Interleaved 25, Checked Interleaved 25, EAN 8, EAN13, Code 128, CODABAR (ohne Prüfsumme), UCC Code 128, Code 2 of 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E, und postalische Barcodes. Eine vollständige Liste aller erkannten Barcodes finden Sie unter Spezifikationen.
- 2D Barcodeerkennung (PDF417)
Die 2D Barcodeerkennung erkennt PDF417, den Industriestandard für 2D Barcodes. Er beinhaltet bis zu 1,1 KB an kodierten Daten, inklusive Text- und Grafikinformationen.
- Schnelle Barcodefindung
Diese Funktion ermöglicht die automatische Auffindung und Erkennung von Barcodes, egal wo und in welchem Winkel sie sich auf einem Dokument befinden. Dies ist sowohl für 1D als auch für 2D Barcodes möglich.
Field Level (Zonal) Erkennung
Das SDK bietet große Leistungsfähigkeit zur Gewährleistung der Erkennungsgenauigkeit und zur Erhöhung der Verarbeitungsgeschwindigkeit bei kleinen Zonen/Bereichen. Diese Funktionalität ist entscheidend für bestimmte Verarbeitungsaufgaben wie beispielsweise Extrahieren von Daten sowie Indizierung und Klassifizierung von Schlüsselbegriffen. Die wichtigsten Funktionalitäten zur Field Level (Zonal) Erkennung sind mehrsprachige OCR sowie die Barcode-Erkennung, die folgende Features beinhaltet:
- Definition der Feldinhalte durch den Einsatz von Alphabeten und Wörterbüchern.
- Erkennung von Zeichenabständen und Zwischenräumen, mit genauer Erkennung von Feldern, in denen Leerzeichen zugelassen sind. FineReader Engine 8.0 erlaubt auch die Benutzung von speziellen Wörterbüchern mit Kombinationen aus Wörtern und Leerzeichen.
- Säubern von Textblöcken, mit der Möglichkeit, den Schwellenwert der Filterung festzulegen.
- Feinabstimmung der Erkennungsergebnisse durch Änderungen im Erkennungsprozess, basierend auf unterschiedlichen Hypothesen auf der Ebene von Wörtern oder Buchstaben.
PDF-Umwandlung
Das SDK bietet leistungsstarke PDF Umwandlungstechnologie mit umfangreichen Funktionen für PDF Input und Output, einschließlich:
- PDF-Sicherheit und Unterstützung von Verschlüsselungen
Das SDK unterstützt eine Reihe verschiedener PDF Sicherheitseinstellungen, und erweitert so seine Einsatzmöglichkeiten für den Public Sector und andere Organisationen, die hohe Sicherheitsanforderungen stellen.
- Passwortgeschütztes "Öffnen von Dokumenten", um unberechtigten Zugang zu Dateien auszuschließen.
- Einschränkung bestimmter Funktionen, wie z.B. Drucken, Bearbeiten oder Entnahme von Inhalt durch Zugangspasswörter.
- Unterstützung der neuesten Verschlüsselungsstandards.
- Ausgabe im Tagged PDF-Format, das an verschiedene Seiten- oder Bildschirmgrößen angepasst werden kann. Ideal für die Anwendung mit Handhelds (PDAs) oder Bildschirmlesern, wie sie beispielsweise von Personen mit Sehbehinderung verwendet werden.
- Seitengröße – Möglichkeit zur Festlegung der Größe aller Seiten im ausgegebenen PDF-Dokument.
- Links in PDF-Dateien – Hyperlinks innerhalb eines PDFs werden beibehalten.
Funktionalität der Entwickler-Plattform und Steuerung der Verarbeitungsgeschwindigkeit
FineReader Engine 8.0 for Mac bietet unterschiedliche Features, die Integratoren die individuelle Einstellung der für ihre Lösungen optimalen Erkennungsgenauigkeit und Verarbeitungsgeschwindigkeit erlauben. Die Engine unterstützt den Verarbeitungsmodus „ausbalanciertes Verfahren” und bietet vorbereitete Beispiele zur schnelleren Auswahl der richtigen Parameter bei häufig vorkommenden Szenarios (z.B. Umwandlung in durchsuchbares PDF, Field Level Erkennung, Archivierung und Indizierung).
- Einfach zu bedienende Entwickler-Tools
Zusätzlich zur API bietet FineReader Engine 8.0 for Mac auch ein Command Line Interface (CLI) sowie vorbereitete und einfach anzuwendende Code-Beispiele und Profile für eine schnelle Implementierung.
- Feinabstimmung der Features bei extern ablaufender Erkennung
- Bietet Integratoren eine Vielzahl von Hypothesen auf der Ebene von Wörtern und Buchstaben
- Ermöglicht individuelle Einstellungen bei der Wahl der Hypothesen durch das Hinzufügen zusätzlicher Ranking-Kriterien während des Verarbeitungsprozesses
- Steuerung der Verarbeitungsgeschwindigkeit - FineReader Engine 8.0 bietet unterschiedliche Features, die Integratoren die individuelle Einstellung der für ihre Lösungen optimalen Erkennungsgenauigkeit und Verarbeitungsgeschwindigkeit erlauben. Das Verhältnis von Geschwindigkeit und Genauigkeit kann in drei Modi eingestellt werden – gründliches, ausgeglichenes verfahren oder auch Fast Modus.
- CLI-basierter Rund-um-die-Uhr-Service; im Hintergrund ablaufende OCR für Kunden, die im Multiprogrammbetrieb arbeiten (z.B. ASPs und interne Dienstleister).
Übernahme und Export von erkanntem Text
FineReader Engine API bietet viele Optionen für den Export von Erkennungsergebnissen, inklusive verschiedener Möglichkeiten für die Wiedergabe von Formatierung und Layout:
- Eine Reihe unterschiedlicher Einstellungen zur Beibehaltung der Textformatierung bei Export in andere Formate (von nur Text ohne Formatierung bis zur kompletten Layoutübernahme inklusive Spalten, Tabellen, Rahmen, Schriftart, Schriftgröße, Formatierung der Absätze etc.).
- Zugang zu detaillierten Informationen über jedes erkannte Zeichen.
- Verschiedene Funktionen für die Nachbearbeitung und Formatierung von erkanntem Text vor dem Export.
- Export des erkannten Textes in verschiedene Formate (eine komplette Liste der Exportformate finden Sie unter Spezifikationen).
- Komplette Layoutübernahme für Dokumente.
- Ersetzen unklarer Zeichen durch ein Bild des Zeichens bei der Überführung ins PDF-Format.
- Beibehaltung von Bildern und Textfarbe.
< zurück