Region wählen
Global Web Site - English
North America - English
Western Europe - English
Western Europe - Deutsch
Western Europe - Français
Western Europe - Italiano
Russia - Русский
Ukraine - Русский
Australia - English
Czech Republic - Čeština
Slovakia - Slovenský
China - 简体中文
Greece - Ελληνικά
Brazil - Português
South America - Español
Turkey - Türkçe
OCR, ICR und andere Erkennungstechnologien
ABBYYs OMR Technologie erkennt einfache und gruppierte Auswahlfelder, Model Checkmarks, und Auswahlfelder, die von Hand "korrigiert" wurden.
OMR bietet eine Erkennungsgenauigkeit von 99.995 %
Mit den voreingestellten Verarbeitungsmodi in FineReader Engine können Entwickler schnell und einfach das richtige Verhältnis hinsichtlich Geschwindigkeit und Genauigkeit für ihr jeweiliges Projekt einstellen. Zusätzlich zum Default Verarbeitungsmodus können OCR und ICR in den drei Modi "Normal", "Fast Mode" und "Balanced Mode" ausgeführt werden.
Es gibt zwei Arten der Erkennung: Erkennung von Volltext und Fleid Level/Zonal Erkennung. Der Hauptunterschied ist der, dass Volltexterkennung normalerweise OCR-Technologie nutzt und für Dokumentenkonvertierung verwendet wird. Field Level/Zonal Erkennung hingegen beinhaltet OCR, ICR und andere Technologien und wird zumeist für das Extrahieren bestimmter Daten aus bestimmten Bereichen des Dokumentes verwendet.
Die folgende Tabelle zeigt die Spezifikationen der zwei Erkennungsarten:
|
Spezifikation |
Volltext-Erkennung |
Field Level/Zonal Erkennung |
| Anwendungsszenario | Dokumentenkonvertierung, Archivierung von Büchern | Data Capture (Datenerfassung) |
| Dokumentenanalyse | Allgemeine DA, DA für Rechnungen, DA für Volltext-Indexierung | Manuelle Spezifizierung der Blöcke für Field Level-Erkennung |
| Erkennung | OCR mit einer allgemeinen Genaugkeit von etwa 96-99% |
OCR, ICR, Erkennung von Auswahlfeldern (OMR,) Barcode-Erkennung mit vordefinierten Datentypen und möglichen Werten. Genauigkeit von etwa 100% |
| Verifizierung | Empfohlen, falls Inhalt weiterverwendet werden soll | In den meisten Fällen obligatorisch |
| Synthese | Angewendet für das Wiederfinden von Dokumenten | Nicht angewendet |
| Export der Erkennungsergebnisse | Dokumentdateien (RTF, DOC, PDF, etc.) |
Export zu XML-Datei oder Datenbank |
Volltext-Erkennung ist die Grunderkennungsart für unterschiedliche Aufgaben, z.B.
Erfahren Sie mehr über Erkennungsaufgaben und Profile >>
All diese Aufgaben machen die Erkennung des gesamten Textes auf dem Dokument/der Dokumentseite notwendig. Vor der Erkennung wird normalerweise Dokumentenanalyse durchgeführt, die die folgenden Schritte ausführt: Trennung von Doppelseiten, Korrektur der Seitenorientierung (Drehung), Identifikation von Textblöcken, Bildern und anderen Elementen.
Nach der Erkennung rekonstruiert die Dokumentensynthese die Struktur und das Layout des Dokuments (für spätere Weiterverwendung des Inhalts) oder gibt lediglich die korrekte Textreihenfolge bei komplex aufgebauten Dokumenten mit mehreren Spalten und Bildern wieder (für Archivierung). Der erkannte Text wird je nach Aufgabe als reiner Text oder als ein Dokument in einem definierten Dateiformat ausgegeben.
Der Text kann manuell verifiziert werden, um seine Genauigkeit zusätzlich zu erhöhen.
ABBYY FineReader Engine 10 bietet umfassende Funktionalitäten für Field Level/Zonal Erkennung für die Ausführung wichtiger Geschäftsprozesse wie Formularverarbeitung sowie Klassifizierung und Indexierung von Schlüsselwörtern. Leistungsstarke Funktionen zur Verarbeitung von Bildern steigern zudem die Fähigkeit, auch kleine Bereiche richtig auszulesen, auch wenn sie grafische Elemente enthalten, die die Erkennung stören können (z. B. unterstrichener Text, durch Scannen entstandene Bildstörungen, etc.)
Field Level/Zonal Erkennung bietet mehrsprachige OCR und ICR, Auswahlfelder-Erkennung (OMR), Erkennung von Barcodes und eine Reihe spezifischer Funktionen wie:
Field Level/Zonal Erkennung wird von den spezifischen Tools für Entwickler unterstützt, wie Voting API und "On-the-Fly" Tuning. Details finden Sie unter Verbesserte Entwickler-Tools
FineReader Engine bietet eine API, um eigene Erkennungssprachen zu erstellen und zu bearbeiten, Systemerkennungssprachen zu kopieren und anzupassen, sowie neue Wörter in vorhandene Benutzersprachen einzufügen.
Hier finden Sie zwei Beispiele, bei denen eigene Benutzersprachen helfen, die Erkennungsgenauigkeit zu erhöhen.
In den meisten Fällen kann FineReader Engine Texte auch ohne vorheriges Training erfolgreich auslesen. Bei der Erkennung von dekorativen Schriften und Schriften mit Umriss, oder wenn eine große Menge von Texten in niedriger Druckqualität eingelesen werden soll, hat sich jedoch vorheriges Training des Programms an Mustern bewährt.
FineReader Engine bietet die Möglichkeit, Benutzermuster zu erstellen und anzuwenden oder diese von den ABBYY FineReader Desktop Applikationen (Professional oder Corporate Edition) zu importieren.
FineReader Engine ist flexibel und einsetzbar. Sie können eigene Anwendungen mit flexibler Architektur erstellen, von einer entwickelte Einzelplatz-Anwendung bis hin zu einer skalierbaren, serverbasierten Lösung.
Dokumenteingabe
Bildvorverarbeitung
Dokumentanalyse
Erkennung
Ausgabe und Export von erkanntem Text
| Broschüre Deutsch (552 KB) |
|
| Broschüre Englisch (553 KB) |