Region wählen
Global Web Site - English
North America - English
Western Europe - English
Western Europe - Deutsch
Western Europe - Français
Western Europe - Italiano
Russia - Русский
Ukraine - Русский
China - 中文
Brazil - Português
Die von FineReader Engine API unterstützten Funktionen können in folgende Gruppen unterteilt werden:
ABBYY FineReader Engine kann Bilder und Dateien aus drei verschiedenen Quellen erhalten: Scans über die TWAIN Schnittstelle (inklusive ADF-Unterstützung und manueller Papierzufuhr), direkt aus dem Arbeitsspeicher oder durch das Öffnen aus Verzeichnissen. Unterstützt werden die meisten Bildformate, einschließlich mehrseitigen TIFFs und JPEG 2000 (Teil 1) sowie die Farbräume Schwarz-Weiß, Graustufen und RGB-Farben. ABBYY FineReader Engine kann auch PDFs öffnen. Hierzu wird die Adobe® PDF Library Technologie eingesetzt um höchste Kompatibilität sicher zu stellen.
ABBYY FineReader Engine 10 ermöglicht das Management von Scan-Parametern: Helligkeit, Farbintensität, Auflösung, Bildgröße, beidseitiges Scannen, Pausen zwischen dem Einrichten von Seiten, etc.
FineReader Engine kann auch originale und modifizierte Bilder in verschiedenen Formaten abspeichern. Eine komplette Liste der Ein- und Ausgabeformate für Bilder finden Sie unter ABBYY FineReader Engine 10 Spezifikationen.
Nach Erhalt der Bilder kann FineReader Engine folgende Vorverarbeitungsprozesse durchführen, um die Erkennung zu verbessern:
Automatische Begradigung von Textzeilen
Diese Funktion ist vor allem dann wichtig, wenn vom Scanner übermittelte Bilder eine Entzerrung des Bildes notwendig machen. Die Definition von Seitenrahmen oder –linien wird hierbei nicht benötigt. Für Formularverarbeitungssoftware ist die Berechnung der Schräglage auf Basis von Referenzblöcken möglich. FineReader Engine 10 bietet mehrere Methoden zur Entzerrung von Bildern: anhand von Paaren schwarzer Quadrate, Linien oder Textzeilen.
Teilung von Doppelseiten
Perfekt für das Einscannen von beiden Seiten eines geöffneten Buches. Die Erkennungsqualität ist höher, wenn nach dem Scannen die Seiten geteilt werden, sodass jede Seite einer Buchseite entspricht. Texterkennung und Layoutanalyse werden dann für jede Seite separat durchgeführt, ebenso die Begradigung, sofern notwendig.
Säubern von Bildern
Zur Reinigung von „Schmutz“ in Bildern. Das Bild könnte sehr viele Störungen enthalten, z.B. viele überschüssige Pixel aufweisen. Die Punkte treten auf bei Dokumenten mit mittlerer bis niedriger Qualität, und wenn sich diese in der Nähe von Zeichenrändern befinden, können sie einen negativen Einfluss auf die OCR-Erkennungsqualität haben. In diesen Fällen kann die Technologie zur Beseitigung von „Schmutz“ die Erkennungsqualität verbessern.
Adaptive Binarisierung und Entfernen von Texturen
Technologie zur Beseitigung von „Hintergrundauschen“ wie Farbe und Textur, was eine höhere Erkennungsgenauigkeit bei schwer lesbaren Dokumenten, wie z.B. Zeitungen, farbigen Dokumenten, Faxen und Kopien bewirkt. Die innovative Technologie der Adaptiven Binarisierung passt während der Erkennung die Schwellwerte der Helligkeit für jedes Bildfragment dynamisch an. Durch den Einsatz individueller Parameter werden Dokumente besser erkannt, deren Hintergrund und Textur in Graustufen, unterschiedlichen Farben oder unterschiedlichen Kontraststärken gehalten sind.
Automatische Ausrichtung gedrehter Bilder (um 90, 180, 270 Grad)
Dieses Feature ist besonders wichtig, wenn Dokumente über einen Automatischen Stapeleinzug eingespeist werden und nicht immer bekannt ist, mit welcher Ausrichtung das Blatt eingescannt wurde. Das Leseverfahren von FineReader erkennt automatisch die Ausrichtung der Seite und korrigiert sie, wenn nötig.
Ändern der Textfarbe und oder des Hintergrunds in den Erkennungsbereichen
Ein wichtiges Feature für Kunden, die mit Dokument-Management-Systemen arbeiten. Hier ein typisches Szenario für seine Anwendung: Ein bereits eingelesenes Bild ist im Archiv als Bild und als Volltext abgelegt worden. Das archivierte Inhaltsverzeichnis enthält zudem die Koordinaten jedes Zeichens auf der Seite. Startet man nun eine Archivsuche, so wird das Abbild des Dokumentes als Quelle des gesuchten Textes angezeigt. Mit Hilfe dieses Features von FineReader Engine ist der gesuchte Text farbig markiert und auch farbig unterlegt.
ABBYY OCR für Digitalfotos
Die neue Technologie unterscheidet zwischen Abbildern von Dokumenten, die mit der Digitalkamera aufgenommen und denen, die per Scanner erfasst wurden. Sie wendet bei der Verarbeitung jeweils unterschiedliche Algorithmen an und korrigiert die spezifischen Probleme, die bei Digitalbildern oft zu beobachten sind: ungenügende Belichtung, unscharfen Text, schiefe Textzeilen und fehlende Angaben zu Auflösung.
Säuberung des Bildes in bestimmten Textblöcken/Zonen,
mit der Möglichkeit, den Schwellwert des Filters festzulegen.
Datenextrahierung von Feldern mit unterschiedlichen Rändern und Rahmen,
wie z.B. Combobox, unterstrichene Felder, Kästen etc. FineReader Engine bietet ebenfalls eine Reihe von Funktionen für Bildvorverarbeitung, wie beispielsweise „Bild skalieren“, „Bild zuschneiden“, „Vorschau erstellen“, „Bild rotieren (90, 180, 270 Grad)“, „Zeilenbegradigung“, „Spiegeln“ und „Textinvertierung“.
Die Dokumentenanalysefunktionen von FineReader Engine API lösen Aufgaben wie z.B. die automatische Dokumentenumwandlung mit kompletter Layoutübernahme, OCR nach Zonen mit manuell definierten Blöcken und Formularverarbeitung mit Vorlagenabgleich. Das beinhaltet:
Spezielle Features zur Dokumentenanalyse sind:
Dokumentenanalyse für Rechnungen
Eine besondere Dokumentenanalyse für die Verarbeitung von semi-strukturierten Dokumenten wie z.B. Rechnungen, Kontoauszügen, Schecks, Überweisungen, Visitenkarten, Verträgen, Krankenversicherungsanträgen, Lebensläufen etc. Während der Bildanalyse versucht die Software, so viel Text auf den Dokumenten zu finden wie möglich, inklusive Zeichen und Ziffern – und dies sogar dann, wenn sich die Information innerhalb von Stempeln, Bildern, Logos oder kleinen Textblöcken befindet.
Anders als bei der standardmäßigen ganzseitigen Dokumentenanalyse geht diese besondere Dokumentenanalyse davon aus, dass jede Information auf dem Dokument relevanter Text ist. Sie garantiert auch, dass wichtige Textinformationen nicht als grafische Elemente eingestuft werden und keine Aufteilung von Wörtern oder Zahlen in mehrere einzelne Zeichen erfolgt. Das Ergebnis ist ein Maximum an Informationen über den Text inklusive der Koordinaten der jeweiligen Daten. Diese Informationen können für weitere Analyse, Bearbeitung von Feld zu Feld sowie Syntaxanalyse bei weiteren Verarbeitungsschritten auf anderen Systemen verwendet werden.
Dokumentenanalyse für die Erstellung von Inhaltsverzeichnissen bei Volltext
Diese Funktion findet und erkennt automatisch jeden Text auf dem Dokument, inklusive Text in Bildern, Grafiken und Diagrammen. Entwickler könnten diese Funktion wählen, wenn sie die gesamte Information in einem Dokument erfassen müssen, um ein Inhaltsverzeichnis des Dokumentes zu erstellen (z.B. bei Dokument-Management-Systemen, Content-Management-Systemen oder Archivierungssystemen).
Field Level/Zonal-Erkennung
FineReader Engine bietet vollständige Field Level/Zonal Erkennung um wichtige Geschäftsprozesse wie Formularverarbeitung, Schlagwortklassifizierung und Schlüsselwortindizierung durchzuführen. Leistungsstarke Bildvorverarbeitungsfunktionen steigern die Fähigkeit von FineReader Engine, kleine Textbereiche jeglicher Qualität und alle Nuancen der Bilder zu erkennen, was die Erkennungsgenauigkeit steigert (z.B. unterstrichener Text, "Müll" nach dem Scannen, Freiflächen im Text, etc.) Die wichtigsten Funktionen von Field Level oder Zonal Erkennung beinhalten mehrsprachige OCR und ICR, OMR und Barcode-Erkennung und die folgenden Bereiche von erkennungsspezifischen Field Level-Funktionen und Verbesserungen, darunter sind:
Field Level/Zonal Erkennung wird zudem unterstützt durch neue Entwicklungen wie Voting API und "On-The-Fly" Tuning (Weitere Einzelheiten dazu finden Sie im folgenden Abschnitt).
OCR
* Die komplette Liste unterstützter Sprachen für OCR/ICR finden Sie unter „Spezifikationen“.
ICR
OMR, Barcode
Verarbeitungsmodi
Sowohl für OCR als auch für ICR können zwei unterschiedliche Verarbeitungsmodi ausgewählt werden:
Benutzersprachen
Hier finden Sie zwei Beispiele, bei denen eigene Benutzersprachen helfen, die Erkennungsgenauigkeit zu erhöhen.
In per Hand ausgefüllten Dokumenten gehören die Angaben in den einzelnen Feldern normalerweise zu einer spezifischen Überschrift, wie z.B. Stadt, Land, PLZ, Artikelnummer, Summe etc. Um die Qualität des ICR Erkennung zu steigern können Sie eigene Benutzersprachen verwenden, um die Information zu definieren, die jedes Feld beinhalten könnte.
Wenn ein Dokument „unnatürliche“ Strukturen beinhaltet, wie z.B. Artikelnummern, Telefonnummern, Passnummern etc., können Erkennungsfehler auftreten. Das liegt daran, dass das Programm diese Daten Zeichen für Zeichen liest. Um die Erkennungsqualität solcher Angaben zu verbessern, können Sie eine neue Erkennungssprache erstellen, mit deren Hilfe das Programm diese spezifischen Informationen korrekt erkennen wird.
FineReader Engine bietet eine API, um verschiedene Erkennungssprachen zu erstellen und zu bearbeiten, Systemerkennungssprachen zu kopieren und anzupassen, sowie neue Wörter in vorhandene Benutzersprachen einzufügen.
Muster Training
In den meisten Fällen kann FineReader Engine Texte auch ohne vorheriges Training erfolgreich auslesen. Bei der Erkennung von dekorativen Schriften und Schriften mit Umriss, oder wenn eine große Menge von Texten in niedriger Druckqualität eingelesen werden soll, hat sich jedoch vorheriges Training des Programms an Mustern bewährt.
FineReader Engine bietet die Möglichkeit, Benutzermuster zu erstellen und anzuwenden oder diese von den ABBYY FineReader Desktop Applikationen (Professional oder Corporate Edition) zu importieren. FineReader Engine ist flexibel und einsetzbar für die Erstellung von Applikationen mit jeglicher Struktur, ob es sich nun um eine neu entwickelte Einzelplatz-Anwendung handelt (FineReader Engine verfügt über kein fertiges User-Interface), oder eine serverbasierte Lösung.
PDF Input
Intelligente PDF-Verarbeitung
FineReader Engine analysiert interne Informationen im ursprünglichen PDF-Dokument wie z.B. Kommentare, Metadaten, Textobjekte, Schriftartlisten und Datenflüsse und steigert mit dieser effizienteren und genaueren Auswahl die Leistung und Geschwindigkeit des PDFs. Bei eingebettetem Text wird zunächst die Vollständigkeit der Textebene überprüft und anschließend entschieden, ob die Textebene als Ganzes entnommen oder blockweise OCR durchgeführt werden soll.
Erfassung interner PDF-Informationen,
durch Auslesen von internen PDF-Links, Hyperlinks und Dokumenteigenschaften, wie z.B. Thema, Autor, Überschrift und Schlüsselwörter.
PDF Output
PDF-Sicherheit und Unterstützung von Verschlüsselungen:
Die neue Plattform in Version 8.1 unterstützt eine Reihe verschiedener PDF Sicherheitseinstellungen, und erweitert so seine Einsatzmöglichkeiten für den Public Sector und andere Organisationen, die hohe Sicherheitsanforderungen stellen.
Ausgabe im Tagged PDF-Format, das an verschiedene Seiten- oder Bildschirmgrößen angepasst werden kann. Ideal für die Anwendung mit Handhelds (PDAs) oder Bildschirmlesern, wie sie beispielsweise von Personen mit Sehbehinderung verwendet werden.
Seitengröße - Möglichkeit zur Festlegung der Größe aller Seiten im ausgegebenen PDF-Dokument.
Links in PDF-Dateien - Hyperlinks innerhalb eines PDFs werden beibehalten.
PDF/A Export – Export ins PDF/A-Format, was als ISO-Standard für die langfristige Speicherung seitenbasierter Dokumente empfohlen wird.
MRC-Komprimierung von PDF(/A)s – Ausgabe-PDFs haben bei gleichbleibender Qualität eine deutlich verringerte Dateigröße. MRC-komprimierte PDFs sind somit ideal bei der Verarbeitung von Farbdokumenten.
Export von CJK zu PDF – Ermöglicht die Umwandlung von Dokumenten in Chinesisch (vereinfacht und traditionell), Japanisch und Koreanisch ins PDF-Format.
Tuning von Qualität und Geschwindigkeit der PDF-Umwandlung
FineReader Engine bietet Entwicklern spezielle Tools, um den für ihre Zwecke optimalen Umwandlungsmodus für PDFs zu gewährleisten.
Neue Tools erweitern die Möglichkeiten der Entwickler, FineReader Engine zu steuern und den Erkennungsprozess im Kern zu beeinflussen:
Voting API
Die Voting API gibt den Entwicklern zusätzliche Informationen über den gerade erkannten Textbereich. Diese zusätzliche Information von FineReader Engine erlaubt die Verwendung externer Voting–Algorithmrn. Die Voting API liefert Alternativen (oder Hypothesen) zur Texterkennung durch Angabe der entsprechenden statistischen Wahrscheinlichkeiten für Buchstaben, Wörter und Zeichentrennung. Dies hilft den Entwicklern bei der Erstellung eigener Voting-Algorithmem für Applikationen, die mehrere Erkennungstechnologien benötigen bzw. nutzen.
"On-the-fly" Tuning während des Erkennungsprozesses
FineReader Engine kann während des Erkennungsprozesses beeinflusst werden. Die Entwickler können die Auswahl der anzuwendenden Hypothesen steuern, indem sie zusätzliche Kriterienlisten aufstellen, die die Technologie während des Erkennungsprozesses zum Erzielen der bestmöglichen Ergebnisse einsetzt. Dieses Feature ist nützlich, wenn für bestimmte Aufgaben spezifische Erkennungskriterien erforderlich sind (eigene Hypothesen für die Erkennungsgenauigkeit).
Code-Beispiele für gängige Aufgabenstellungen
Eine zusätzliche Möglichkeit zur schnellen und einfachen Optimierung der FineReader-Technologie. Ein Satz Code-Beispiele, die direkt angewendet werden können, liefert einen optimalen Ausgleich zwischen Schnelligkeit und Genauigkeit für bestimmte Aufgabenstellungen, wie z.B. Konvertierung in durchsuchbare PDFs, Field Level (Zonal) Erkennung, Archivierung mit Abbild und Indizierung, vollständige Konvertierung der Seite in RTF und HTML. Die Datenbank enthält zudem Beispielbilder und Vergleichsdokumente.
FineReader Engine API bietet viele Optionen für den Export von Erkennungsergebnissen, inklusive verschiedener Möglichkeiten für die Wiedergabe von Formatierung und Layout:
Die visuellen Komponenten sind ActiveX Controls für die einfache Integration von User Interface Elementen in bereits bestehende Applikationen. Entwickler können so den Anwendern direkten Zugang zu Erkennungsergebnissen sowie Funktionen zur Validierung und zur Kontrolle von Dokumenten geben, behalten aber dennoch die volle Kontrolle. Die visuellen Komponenten basieren auf fünf Elementen, entworfen entsprechend ABBYYs Erfahrung in der Entwicklung von Endanwender-Applikationen.
* In der Entwicklung, geplant für ein Wartungsrelease von FineReader Engine 10
Die neue Architektur nutzt alle zur Verfügung stehenden CPUs für die Analyse und Erkennung mehrseitiger Dokumente. Diese Funktion hilft bei der automatisierten Zuordnung und Verteilung von Seiten sowie bei der Koordination der Erkennung und der Synthese der Dokumente.