< zurück
ABBYY FineReader Engine 9.0 for Windows
Technische Spezifikationen
Begleitende Technische Dokumentationen
- Die Hilfefunktion für Entwickler im kompilierten HTML-Format ist in Englisch erhältlich. Sie beinhaltet eine detaillierte Beschreibung der API und allgemeine Informationen über Lizenzierung und Aktivierung.
- Die Code-Beispiele, die mit dem FineReader Engine Entwickler-Toolkit mitgeliefert werden, helfen Entwicklern zu verstehen, wie sie die API in verwenden. Ein Entwickler kann den Beispielcode kopieren, anpassen oder zur Erstellung der eigenen Anwendung nutzen.
- Das Handbuch für Administratoren beinhaltet Informationen über die Installation von FineReader im LAN-Netzwerk eines Kunden sowie über das Management der Lizenzen mit dem Network Licence Manager.
Entwicklungsumgebungen
- Microsoft Visual Studio.NET (VB.NET, C#);
- Microsoft Visual Basic 5.0, 6.0;
- Microsoft Visual C++ 4.x und höher;
- VB Script und weitere Skriptsprachen;
- Borland Delphi 2.0 und höher;
- Jede andere Entwicklungsumgebung, die COM und ActiveX Objekte unterstützt.
Dialogsprachen
Dialogfenster, Text, Fehlermeldungen und andere Mitteilungen des Programms sind in den Sprachen Englisch, Deutsch, Französisch, Spanisch, Italienisch, Niederländisch, Portugiesisch, Russisch, Estnisch, Polnisch, Tschechisch, Slowakisch, Ungarisch, Bulgarisch, Ukrainisch, Schwedisch, Griechisch, Litauisch und Lettisch verfügbar.
Systemvoraussetzungen
Installation einer Einzel- oder einer Entwickler-Lizenz
- PC mit Intel Pentium®/Celeron®/Xeon™, AMD K6/Athlon™/Duron™/Sempron™ oder kompatiblem Prozessor mit mindestens 200 MHz.
- Betriebssystem: Microsoft® Windows® Vista, Windows Server 2003, Windows XP, Windows 2000 und 64-bit Versionen von Windows Vista, Windows Server 2003 und Windows XP.
- Speicherbedarf: 128 MB RAM plus zusätzlich 110 MB für jeden Erkennungsprozess.
- Festplattenspeicher: 350 MB für vollständige Installation der Entwickler-Version und 70 MB für Programmdurchführung.
- 100% TWAIN-kompatibler Scanner, Digitalkamera oder Faxmodem.
- Videokarte und Monitor (Auflösung mind. 800x600).
- Tastatur, Maus oder anderes Zeigegerät.
- Der Anwender muss auch Schreib-/Leserechte für die folgenden Registry-Einträge haben:
- HKEY_CLASSES_ROOT,
- HKEY_LOCAL_MACHINE\Software\ABBYY,
- HKEY_CURRENT_USER\Software\ABBYY.
Installation von Netzwerklizenzen
Voraussetzungen an den Server
- PC mit Intel Pentium®/Celeron®/Xeon™, AMD K6/Athlon™/Duron™ oder kompatiblem Prozessor mit mindestens 200 MHz.
- Betriebssystem: Microsoft® Windows® Vista, Windows Server 2003, Windows XP, Windows 2000 und 64-bit Versionen von Windows Vista, Windows Server 2003 und Windows XP.
- 10 MB freier Festplattenspeicher
Voraussetzungen an die Workstations
- PC mit Intel Pentium®/Celeron®/Xeon™, AMD K6/Athlon™/Duron™/Sempron™ oder kompatiblem Prozessor mit mindestens 200 MHz.
- Betriebssystem: Microsoft® Windows® Vista, Windows Server 2003, Windows XP, Windows 2000 und 64-bit Versionen von Windows Vista, Windows Server 2003 und Windows XP.
- Speicherbedarf: 128 MB RAM plus zusätzlich 110 MB für jeden Erkennungsprozess.
- Festplattenspeicher: 350 MB für die Library und 70 MB für Programmdurchführung.
- 100% TWAIN-kompatibler Scanner, Digitalkamera oder Faxmodem.
- Videokarte und Monitor (min. Auflösung 800x600).
- Tastatur, Maus oder anderes Zeigegerät.
- Der Anwender muss auch Schreib-/Leserechte für die folgenden Registry-Einträge haben:
- HKEY_CLASSES_ROOT - vollständiger Kontrollzugang,
- HKEY_LOCAL_MACHINE\Software\ABBYY - vollständiger Kontrollzugang,
- HKEY_CURRENT_USER\Software\ABBYY - vollständiger Kontrollzugang,
- HKEY_CLASSES_ROOT\CLSID - vollständiger Kontrollzugang
- HKEY_CLASSES_ROOT\TypeLib - vollständiger Kontrollzugang nur für Installation und Aktivierung.
- Die folgenden Ordner müssen von der Workstation zugänglich sein:
- Ordner mit binären Dateien von ABBYY FineReader Engine – vollständiger Kontrollzugang.
- %TEMP% Ordner – vollständiger Kontrollzugang.
- Die folgende Komponente sollte installiert werden:
- o Microsoft® Internet Explorer 5.0 or higher
Wenn Ihre Applikation eine der Methoden von ABBYY FineReader Engine zum Erstellen von Oberflächenelementen verwendet (Dialogboxen), also - Pattern Training, User Pattern, oder Wörterbuch Dialogboxen, so muss Windows Common Controls in der Version 5.80 oder später und Rich Edit Control in der Version 3.0 oder später vorhanden sein.
Eingabe-/Ausgabeformate
Unterstützte Eingabeformate für Bilddateien:
- PDF:
Dateien im PDF-Format (Version 1.6 oder früher), inklusive PDF/Archive (PDF/A). - BMP:
2-bit - unkomprimiert Schwarz-Weiß
4- und 8-bit - unkomprimiert Palette
16-bit - unkomprimiert Mask
24-bit - unkomprimiert Palette und TrueColor
32-bit - unkomprimiert Mask - JPEG:
Grau, Farbe - JPEG 2000:
Grau- Part 1
Farbe- Part 1 - TIFF:
Schwarz-Weiß - unkomprimiert, CCITT3, CCITT3FAX, CCITT4, Packbits, ZIP, LZW.
Grau - unkomprimiert, PackBits, JPEG, ZIP, LZW
TrueColor - unkomprimiert, JPEG, ZIP, LZW
Palette - uncompressed, Packbits, ZIP
Multi image TIFF - GIF:
Schwarz-Weiß - LZW-komprimiert
Grau - LZW-komprimiert
TrueColor - LZW-komprimiert - PNG:
Schwarz-Weiß, Grau, Farbe - DjVu:
Schwarz-Weiß, Grau, Farbe
Ausgabeformate:
- Microsoft Word (DOC).
- Rich Text Format (RTF).
- Microsoft Word XML (XML), nur Microsoft Office Word 2003.
- XML-basierte Microsoft Office 2007 Formate (DOCX, XLSX und PPTX)
- PDF, PDF/A (MRC-Komprimierung für PDF und PDF/A)
- Comma Separated Values (CSV).
- HTML. FineReader Engine unterstützt unterschiedliche Kodierungen (Windows, DOS, Mac, ISO) und Unicode (UTF-8).
- Microsoft PowerPoint (PPT).
- Text (TXT). FineReader Engine unterstützt unterschiedliche Kodierungen (Windows, DOS, Mac, ISO) und Unicode (UTF-16, UTF-8).
- Microsoft Excel (XLS).
- DBF. FineReader Engine unterstützt unterschiedliche Kodierungen (Windows, DOS, Mac, ISO).
Erkennungssprachen
OCR:
ABBYY FineReader Engine 9.0 erkennt 195 OCR Sprachen, darunter:
- 37 Hauptsprachen mit Lateinischen, Kyrillischen, Griechischen oder Armenischen Zeichen, die FineReader Engine auch durch Wörterbücher unterstützt: Armenisch (Ostarmenisch, Westarmenisch, Grabar), Bulgarisch, Katalanisch, Kroatisch, Tschechisch, Dänisch, Niederländisch (Niederlande und Belgien), Englisch, Estnisch, Finnisch, Französisch, Deutsch (neue und alte Rechtschreibung), Griechisch, Ungarisch, Italienisch, Indonesisch, Lettisch, Litauisch, Norwegisch (Bokmal und Nynorsk), Polnisch, Portugiesisch (Portugal und Brasilien), Rumänisch, Russisch, Bashkir, Slowakisch, Slowenisch, Schwedisch, Spanisch, Türkisch, Tatarisch, Ukrainisch.
- 4 Ostasiatische Sprachen mit Wörterbuchunterstützung: Chinesisch (Traditionell und Vereinfacht), Japanisch, Koreanisch.
- Thai
- Hebräisch mit Wörterbuchunterstützung
- 5 FineReader XIX Sprachen mit Wörterbüchern, für die Erkennung von alten Europäischen Dokumenten, gedruckt im 17.-19. Jahrhundert: Englisch, Französisch, Deutsch, Italienisch und Spanisch.
- 133 zusätzliche Sprachen mit lateinischen, kyrillischen und griechischen Buchstaben: Abchasisch, Adygeisch, Afrikaans, Agulisch, Albanisch, Altaisch, Awarisch, Aymara, Aserbaidschanisch (Kyrillisch), Aserbaidschanisch (Latein), Baskisch, Weißrussisch, Bemba, Blackfoot, Bretonisch, Bugotu, Burjatisch, Cebuano, Chakassisch, Chantisch, Chamorro, Chechen, Korsisch, Krim-Tatarisch, Crow, Dakota, Dargwa, Dungan, Eskimo (kyrillisch), Eskimo (Latein), Ewenisch, Ewenkisch, Färöisch, Fidschianisch, Friesisch, Friaulisch, Gagausisch, Galizisch, Ganda, Deutsch (Luxemburg), Guarani, Hani, Haussa, Hawaiisch, Isländisch, Indonesisch, Inguschisch, Irisch, Jakutisch, Jingpo, Kabardinisch, Kalmükisch, Karatschaiisch-Balkarisch, Karakalpakisch, Kaschubisch, Kawa, Kasachisch, Kikuyu, Kirgisisch, Kongolesisch, Korjakisch, Kpelle, Kumykisch, Kurdisch, Lak, Latein, Lesgisch, Luba, Mazedonisch, Malagasisch, Malaiisch, Malinke, Maltesisch, Mansisch, Maori, Mari, Maya, Miao, Minangkabau, Mohawk, Moldawisch, Mongolisch, Mordwinisch, Nahuati, Nenzisch, Nivkh, Nogaisch, Nyanja, Ojibwa, Ossetisch, Papiamento, Provenzalisch, Quechua, Rätoromanisch, Romani, Rundi, Russisch (alte Schreibweise), Ruandisch, Samisch (Lappisch), Samoanisch, Schottisch-Gälisch, Selkupisch, Serbisch (kyrillisch), Serbisch (Latein), Shona, Slowenisch, Somali, Sorbisch, Sotho, Sunda, Suaheli, Swasiländisch, Tabassaranisch, Tagalog, Tahitianisch, Tadschikisch, Tok Pisin, Tongaisch, Tschuktschisch, Tschuwaschisch, Tswana, Tun, Turkmenisch, Tuwinisch, Udmurtisch, Usbekisch (kyrillisch), Usbekisch (Latein), Walisisch, Wolof, Xhosa, Zapotekisch, Zulu.
- 4 künstliche Sprachen: Esperanto, Ido, Interlingua, Okzidentalisch.
- 6 Programmiersprachen: Basic, C/C++, COBOL, Fortran, JAVA, Pascal.
- Einfache chemische Formeln.
- Ziffern.
- Tools für die Entwicklung von benutzerdefinierten Sprachen.
ICR:
ABBYY FineReader Engine bietet ICR für 113 Sprachen, darunter:
- Morphologie/Wörterbuch Unterstützung für 29 Sprachen mit lateinischen Buchstaben, Griechisch und 3 Sprachen mit kyrillischen Buchstaben
- 84 Sprachen ohne Wörterbuchunterstützung.
- Unterstützung von 22 verschiedenen Handschriftarten unterschiedlicher Länder und Regionen: Europa, Amerika, Kanada, Russland, Japan, Arabische Länder und Thai.
Barcode-Typen
- 1D: Check Code 39, Check Interleaved 25, Code 128, Code 39, EAN 13, EAN 13 Supplemental, EAN 8, Interleaved 25, CODABAR (ohne Quersumme), UCC Code 128, Code 2 of 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E und postalische Barcodes.
Add-on Module
Es gibt zahlreiche Add-on Module, verfügbar zusammen mit Runtime Lizenzen. Diese bietet zusätzliche Funktionalitäten:
Visuelle Komponenten
Die visuellen Komponenten sind ActiveX Controls für die einfache Integration von User Interface Elementen in bereits bestehende Applikationen. Verfügbar sind: Scan Interface, Document Viewer, Image Viewer, Text Editor und Text Validator.
Dokumentenanalyse für Rechnungen
Eine besondere Dokumentenanalyse für die Verarbeitung von semi-strukturierten Dokumenten wie z.B. Rechnungen, Kontoauszügen, Schecks, Überweisungen, Visitenkarten, Verträgen, Krankenversicherungsanträgen, Lebensläufen etc.
Dokumentenanalyse für die Erstellung von Inhaltsverzeichnissen bei Volltext
Diese Funktion findet und erkennt automatisch jeden Text auf dem Dokument, inklusive Text in Bildern, Grafiken und Diagrammen. Entwickler könnten diese Funktion wählen, wenn sie die gesamte Information in einem Dokument erfassen müssen, um ein Inhaltsverzeichnis des Dokumentes zu erstellen (z.B. bei Dokument-Management-Systemen, Content-Management-Systemen oder Archivierungssystemen).
PDF Öffnen und Erkennung
ABBYY FineReader Engine 9.0 kann PDF-Dateien öffnen und verarbeiten, das Ergebnis ist eine beinahe 100%-ige Erkennungsgenauigkeit bei häufig genutzten PDFs (inklusive PDFs mit eingebetteten Schriften). Einem intelligenten Ansatz folgend verarbeitet FineReader 9.0 Engine PDF-Dateien in drei Schritten: Zunächst werden PDFs unter Nutzung von Adobe® PDF Library Technologie in Bilddateien umgewandelt. Anschließend wird die Erkennung durchgeführt. Als letzter Schritt wird die Textebene aus dem PDF extrahiert und mit den Erkennungsergebnissen abgeglichen. Dieses Vorgehen beseitigt auch Probleme, die bei der Extrahierung eingebetteter Schriften entstehen können.
PDF Export
Dieses Add-on ermöglicht den Export des ausgelesenen Textes in ein PDF-Format auf vier Arten: Nur Bild, Text und Bild, Text über Bild und Text unter Bild. Unter einer ASCII Lizenz ist ausschließlich der Export als „Nur-Bild-PDF“ möglich.
PDF/A Export
Dieses Add-on erlaubt die Konvertierung des extrahierten Textes in das PDF/A-Format.
MRC-Kompression von PDFs
Ermöglicht die MRC-Kompression von PDFs, die die Dateigröße eines Ausgabe-PDFs deutlich verringern kann.
Export
Alle Informationen über die Texterkennung, die via API verfügbar sind, werden in einer XML-Datei gesammelt.
OCR für Chinesisch, Koreanisch und Japanisch
Für ABBYY FineReader Engine 9.0 gibt es ein Add-on Modul für OCR in den Sprachen Chinesisch (traditionell und vereinfacht), Japanisch und Koreanisch.
OCR für Thai
ABBYY FineReader Engine bietet ein Add-on Modul, das speziell für die Erkennung von Thai entwickelt wurde. Ebenfalls können Dokumente erkannt werden, die Text in Thai und auch anderen Sprachen enthalten, für die OCR verfügbar ist. Die Ergebnisse dieser Texterkennung können als TXT exportiert werden.
OCR für Hebräisch
Das Add-on für OCR in Hebräisch ermöglicht die Erkennung von Dokumenten in Hebräisch sowie Dokumenten, die Text sowohl in Hebräisch als auch in einer anderen, von links nach rechts geschriebenen Sprache enthalten (wie beispielsweise Englisch oder Deutsch). Es ermöglicht somit die Texterkennung in beide Schreibrichtungen auch innerhalb eines Dokuments und den Export ins TXT-Format.
2D Barcode Erkennung
Das Add-on für 2D Barcode Erkennung verarbeitet PDF417, den Industriestandard für 2D Barcodes.
ICR
Das ICR Add-on Modul beinhaltet ICR, ICR von Kyrillisch, OMR und Index text type. Die Lizenzierung von OCR für Kyrillisch unterliegt gesonderten Konditionen. Für genauere Informationen wenden Sie sich bitte an Ihre regionale ABBYY Geschäftsstelle.
OMR
Das Add-on für OMR (Auswahlfelder) erkennt einfache Auswahlfelder, Optionsfelder, Modellauswahlfelder und Auswahlfelder, die über manuelle Korrekturen verfügen. Die Erkennungsgenauigkeit liegt bei 99.995%.
Visuelle Komponenten
Die ActiveX-basierten visuellen Komponenten bieten eine einfache Integration von Interface Elementen in Applikationen. Entwickler können Anwendern direkten aber kontrollierten Zugang zu Erkennungsergebnissen und Funktionen für die Validierung oder die Überprüfung von Dokumenten ermöglichen. Das Set besteht aus fünf Komponenten, entstanden aus ABBYYs Erfahrung in der Entwicklung von Endanwender-Applikationen.
Scan Interface
Bietet ein Interface für den Zugriff auf Scanner über die TWAIN Schnittstelle. Einstellungen für den Scannvorgang können hier ausgewählt werden, etwa Auflösung, Papiereinstellungen, etc.
Document Viewer
Gibt einen Überblick über die gescannten Dokumentseiten und den Status des Erkennungsprozesses. Verfügbar entweder als Miniaturbildansicht oder detailliert in der Tabellenansicht.
Image ViewerZeigt eine gesamte Dokumentseite. Spezielle Werkzeuge erlauben die Bearbeitung des Bildes sowie die Erstellung und Änderung der Erkennungsbereiche, z.B.
- Bilder rotieren lassen, zurecht schneiden und Doppelseiten aufteilen
- Erkennungsgebiete markieren oder Blocktypen festlegen – Text, Bild, Tabelle oder Barcode
- Schaltflächen der Werkzeugleiste können durch Programmierung ein- und ausgeblendet werden, eigene Schaltflächen sind möglich
Text Editor
Bietet die Option, unsicher erkannte Zeichen anzuzeigen sowie grundlegende Tools zur Formatierung des Textes. Entwickler können das Display des Textfeldes, verfügbare Buttons und die Anwendungsschritte des Benutzers überprüfen.
Text Validator
Ein einfach zu bedienendes Werkzeug, um erkannte Zeichen, die mit „unsicher“ gekennzeichnet sind, zu überprüfen. Beinhaltet eine integrierte Rechtschreibprüfung und eine „Zoom“- Funktion für wichtige Teile eines Textes. Entwickler können das Verhalten dieser Komponente kontrollieren.
< zurück