ABBYY FineReader Engine 9.0 for Linux > Technische Spezifikationen

Add-on Module

Es gibt zahlreiche Add-on Module, verfügbar zusammen mit Runtime Lizenzen. Diese bietet zusätzliche Funktionalitäten:

Dokumentenanalyse für Rechnungen

Eine besondere Dokumentenanalyse für die Verarbeitung von semi-strukturierten Dokumenten wie z.B. Rechnungen, Kontoauszügen, Schecks, Überweisungen, Visitenkarten, Verträgen, Krankenversicherungsanträgen, Lebensläufen etc.

Dokumentenanalyse für die Erstellung von Inhaltsverzeichnissen bei Volltext

Diese Funktion findet und erkennt automatisch jeden Text auf dem Dokument, inklusive Text in Bildern, Grafiken und Diagrammen. Entwickler könnten diese Funktion wählen, wenn sie die gesamte Information in einem Dokument erfassen müssen, um ein Inhaltsverzeichnis des Dokumentes zu erstellen (z.B. bei Dokument-Management-Systemen, Content-Management-Systemen oder Archivierungssystemen).

OCR für Chinesisch, Koreanisch und Japanisch

Für ABBYY FineReader Engine 9.0 gibt es ein Add-on Modul für OCR in den Sprachen Chinesisch (traditionell und vereinfacht), Japanisch und Koreanisch.

OCR für Thai

ABBYY FineReader Engine bietet ein Add-on Modul, das speziell für die Erkennung von Thai entwickelt wurde. Ebenfalls können Dokumente erkannt werden, die Text in Thai und auch anderen Sprachen enthalten, für die OCR verfügbar ist. Die Ergebnisse dieser Texterkennung können als TXT exportiert werden.

OCR für Hebräisch

Das Add-on für OCR in Hebräisch ermöglicht die Erkennung von Dokumenten in Hebräisch sowie Dokumenten, die Text sowohl in Hebräisch als auch in einer anderen, von links nach rechts geschriebenen Sprache enthalten (wie beispielsweise Englisch oder Deutsch). Es ermöglicht somit die Texterkennung in beide Schreibrichtungen auch innerhalb eines Dokuments und den Export ins TXT-Format.

PDF Öffnen und Erkennung

ABBYY FineReader Engine 9.0 kann PDF-Dateien öffnen und verarbeiten, das Ergebnis ist eine beinahe 100%-ige Erkennungsgenauigkeit bei häufig genutzten PDFs (inklusive PDFs mit eingebetteten Schriften). Einem intelligenten Ansatz folgend verarbeitet FineReader 9.0 Engine PDF-Dateien in drei Schritten: Zunächst werden PDFs unter Nutzung von Adobe® PDF Library Technologie in Bilddateien umgewandelt. Anschließend wird die Erkennung durchgeführt. Als letzter Schritt wird die Textebene aus dem PDF extrahiert und mit den Erkennungsergebnissen abgeglichen. Dieses Vorgehen beseitigt auch Probleme, die bei der Extrahierung eingebetteter Schriften entstehen können.

PDF-Export

Dieses Add-on ermöglicht den Export des ausgelesenen Textes in ein PDF-Format auf vier Arten: Nur Bild, Text und Bild, Text über Bild und Text unter Bild. Unter einer ASCII Lizenz ist ausschließlich der Export als „Nur-Bild-PDF“ möglich.

PDF/A Export

Dieses Add-on erlaubt die Konvertierung des extrahierten Textes in das PDF/A-Format.

MRC-Kompression von PDFs

Ermöglicht die MRC-Kompression von PDFs, die die Dateigröße eines Ausgabe-PDFs deutlich verringern kann.

XML-Export

Alle Informationen über die Texterkennung, die via API verfügbar sind, werden in einer XML-Datei gesammelt.

2D Barcode Recognition

Das Add-on für 2D Barcode Erkennung verarbeitet PDF417, den Industriestandard für 2D Barcodes.


Andere Spezifikationen von ABBYY FineReader Engine 9.0 for Linux:

Systemvoraussetzungen
Eingabe-/Ausgabeformate
Erkennungssprachen
Barcode-Typen
Add-on Module