OmniPage Capture SDK: Entwickler-API zur Integration von OCR in C++, C# und Java

Das Entwicklerkit OmniPage Capture SDK ist die Kern­technik aller Kofax-Bild­verarbeitungs­lösungen und gilt als das branchenweit führende Toolkit für Bild­verarbeitung und OCR unter Windows, Linux und MacOS.

Vielfältige und zuverlässige Anwendungen mit höchster Verfügbarkeit

Dank innovativer Features können Entwickler robuste, lang­lebige Anwendungen zur Dokumenten­konvertierung entwickeln, die sich automatisch skalieren lassen und die gesamte oder anteilige Prozessor­leistung eines Mehrkern­rechners optimal ausschöpfen. All das lässt sich mit minimalem Programmier­aufwand erreichen.

Leistungsstarke Formular­verarbeitung für all Ihre strukturierten Dokumente

Das OmniPage Capture SDK liefert alle Tools und Funktionen, die zur Entwicklung von Anwendungen für Formular­ver­arbeitung benötigt werden. Es ermöglicht die einfache Erstellung von Formular­vorlagen für verschiedenste Dokument­typen und bietet eine praktische API zur Vorlagen­zuordnung und Formular­daten­extraktion.

Automatisierte und lernfähige Dokumenten­klassifizierung

Mit der Dokumenten­klassifizierung können Dokumente nach Layout oder Text­inhalt gruppiert und sortiert werden. Das intelligente Tool kann trainiert und in unter­schied­lichsten Geschäfts­prozessen wie E‑Mail-Weiter­leitung, Post­ein­gangs­sortierung, Spam-Filterung, Formular­bearbeitung und Daten­extraktion eingesetzt werden.

Neuerungen in Version 21

Schneller, einfacher, intuitiver

Bei Entwicklern, die ihre Anwendungen schnell und einfach um anspruchsvolle OCR-, Bildverarbeitungs- und PDF-Funktionen erweitern möchten, zählt das OmniPage Capture SDK seit jeher zum Nonplusultra.

    • Vereinfachung der Installation und Lizenzierung
    • Verbesserung der Handschrifterkennung durch die neue ICR2-Engine
    • Optimierung der automatischen Spracherkennung und der 3D-Entzerrung
    • Zusätzliche Unterstützung für Dokumentausgabe als PDF/A-1a, -2a, -3a, -3b und -3u und HTML5
    • Neuer intuitiver Verteilungsassistent
    • Zusätzliche praktische und hoch produktive APIs und Einstellungen
    • Automatisierbares Trainings-Tool zur Dokumentklassifizierung
    • OCR-Verarbeitung für Hebräisch und formatierte Text-Ausgabe für Arabisch
OmniPage Capture SDK ist in der Version 20 noch besser, schneller, effizienter und dadurch günstiger als seine Vorgänger
Verbesserte Erkennung
0%
Zeichengenauigkeit
0%
Layoutgenauigkeit

Die Erkennungsgenauigkeit bei asiatischen Sprachen wurde in der neuen Version enorm gesteigert: die Layoutgenauigkeit um ganze 45%, die Zeichengenauigkeit um bis zu 40%. Außerdem enthält das SDK jetzt eine OCR-Engine für Thailändisch.

Formularverarbeitung leicht gemacht
OmniPage Capture SDK hilft bei der Formularverarbeitung

Die Techniken zur Formularverarbeitung wurden im neuen OmniPage Capture SDK stark verbessert. Es enthält jetzt den Form Template Editor, ein leistungsstarkes Tool zum Erstellen, Bearbeiten, Testen und Verwalten von Formularvorlagen. Verbesserte Funktionsaufrufe sorgen überdies für eine zuverlässige Vorlagenzuordnung und eine bequeme Formulardatenextraktion.

Bessere Genauigkeit durch Einbindung von Metadaten
OmniPage Capture SDK unterstützt beim Fotografieren eines Dokuments mit einem Handy

Das OmniPage Capture SDK ermöglicht eine bessere Verarbeitung von mit Digital­kameras oder Handys aufgenommenen Bildern, da es jetzt auch EXIF-Daten einbezieht. Eine Fülle neuer Algorithmen zur Berech­nung der Auflösung, eine Korrektur­funktion für die Schattierung sowie neue Work­flows sorgen dafür, dass bei der Bild­konvertierung so viele Daten wie möglich erfasst und in Text umgewandelt werden.

Benutzer­­freundliche APIs

Das OmniPage Capture SDK (Software Development Kit) bietet Software-Entwicklern verschiedene Programmierschnittstellen und eine große Fülle an Samples. Die Auswahl der richtigen Schnittstelle und der Einstieg in die Programmierung sind allerdings für den Einsteiger aufgrund der schieren Menge an Modulen und Funktionen nicht immer offensichtlich.
Alle drei Programmierschnittstellen des SDK decken nahezu dieselbe Funktionalität ab und liefern dieselbe OCR-Qualität. Sie verfolgen aber unterschiedliche Konzepte und wurden teilweise für mehrere Programmiersprachen implementiert. Abhängig davon, welche Programmiersprache Sie verwenden und ob Sie die Visual Controls des SDK benötigen, können Sie die Auswahl der für Sie am besten geeigneten Schnittstelle sehr schnell eingrenzen.

Diese klassische, funktionsorientierte Schnittstelle steuert die Bildeingabe, Bildverarbeitung, Erkennung und Ausgabe. Sie gliedert sich in einen Kernel Level zur Verarbeitung von Einzelseiten und in einen Plus Level für mehrseitige Dokumente. Sie kann mit allen nativen Programmiersprachen verwendet werden, die Funktionen aus DLLs aufrufen können. In C# ist sie in Form von zwei großen statischen Klassen definiert.

Wann sollte man RecAPI verwenden?

  • Bei Verwendung nativer Programmiersprachen, die Funktionen aus DLLs aufrufen können
  • Bei Portierung vorhandener Capture-SDK-Projekte

Beispiele:

  • Beispiel 1 – Konvertierung einer Bilddatei in ein durchsuchbares PDF-Dokument
  • Beispiel 2 – Text- und Barcode-Erkennung auf allen Seiten einer Bilddatei

Diese moderne Klassenbibliothek bietet dieselbe Funktionalität wie die native RecAPI, ist aber die erste Wahl für C#-Programmierer.

Wann sollte man .NET Objects verwenden?

  • Bei allen neuen C#-Projekten, die keine Visual Controls (Steuerelemente der Professional Toolbox) benötigen

Beispiele:

  • Beispiel 1 – Konvertierung einer Bilddatei in ein durchsuchbares PDF-Dokument
  • Beispiel 2 – Text- und Barcode-Erkennung auf allen Seiten einer Bilddatei

Diese ActiveX-Schnittstelle bietet eine ältere Klassenbibliothek und ist der einzige Zugang zu den Steuerelementen (Visual Controls) der Professional Toolbox.

Wann sollte man IPRO verwenden?

  • Bei Projekten, die Visual Controls (Steuerelemente der Professional Toolbox) benötigen
  • Bei VB.NET-Projekten

Betriebssysteme

Kommerziellen Software-Anbietern, denen es auf OCR-Präzision und anspruchsvolle Bildverarbeitung ankommt, bietet das OmniPage Capture SDK skalierbare OCR- und umfangreiche Imaging-Funktionen zur Entwicklung hochwertiger, wettbewerbsfähiger Produkte auf jeder Plattform.

Entwicklungsumgebung:

  • Windows 7, 8, 8.1, 10, jeweils 32- und 64-Bit
  • Windows Server 2008 R2, 2012 R2, 2016
  • Intel- oder AMD-Prozessor 32- und 64-Bit
  • 4 GB Arbeitsspeicher (RAM), 6 GB empfohlen
  • 4 GB freier Festplattenspeicher
  • Microsoft Visual C/C++/C# Version 2003 und neuer
  • Microsoft Visual Basic .NET

Laufzeitumgebung:

  • Windows 7, 8, 8.1, 10, jeweils 32- und 64-Bit
  • Windows Server 2008 R2, 2012 R2, 2016
  • Intel- oder AMD-Prozessor 32- und 64-Bit
  • 2 GB Arbeitsspeicher (RAM), 4 GB empfohlen
  • 300 MB freier Festplattenspeicher

Hardwareanforderungen:

  • Intel or AMD 64-bit-CPUs

Getestete Betriebssysteme:

  • Fedora 20, 21
  • Debian 7.5, 7.7 and 8.1
  • Oracle Linux 6.5, 7.0
  • CentOS 6.3

Hardwareanforderungen:

  • Intel 32-Bit- oder 64-Bit CPUs

Softwareanforderungen:

  • OS X 10.8 oder höher
Main Modules and Features Windows Linux Mac
Western and Asian OCR
Single OCR engine
Two-Way voting engine
Three-Way voting engine
Full Asian engine
Fast Asian engine
Voting Asian engine
Thai OCR engine (Text, XML, Searchable PDF only)
Arabic OCR engine (Text, XML, Searchable PDF only)
Hebrew OCR engine (Text, XML, Searchable PDF only)
Vietnamese OCR engine (Text, XML, Searchable PDF only)
Hong Kong character recognition option
Textual PDF output for Arabic, Thai, Hebrew
Arabic accuracy improvement
Asian zoning and accuracy improvement
Eastern European languages and Turkish OCR accuracy improvements
Support for Form Template Editor format
Asian language support for template form processing API
Standard 1D/2D Barcode
QR and DataMatrix in Standard 2D Barcode
ICR module
Updated and improved ICR engine
OMR module
Document Classifier API
Command Line Document Classifier training tool
Logical Form Recognition (LFR) enhancement and radio button detection
Intelligent Workflow Runner (IWR)
Intelligent Workflow Runner (IWR) API
IWR Customer Workflow
Image and searchable PDF output
Textual PDF output
Language detection—multiple Western languages on same page
Language detection—single Western or Asian language for whole page
Camera/Smartphone image handling improvement
24/7 stability enhancement
Enhanced JPG2K and MRC
More JPG2K speed improvements
PDF/A-1,2,3a, PDF/A-2,3b PDF/A-3u support
PDF font substitution and form field rendering improvements
Formatted output—RTF
Formatted output—DOCX/XLSX/HTML
HTML5 output
Formatted OCR output for Arabic, Hebrew
Formatted OCR output for Thai, Vietnamese
Central Licensing for Scalable Servers
Code security enhancement
Apple Store compliant
Windows Only Features
Professional Visual Toolbox
Form Template Editor (FTE)
Enhanced Form Template Editor with Asian language support
Document Classifier Assistant
WIA2 support
VB and C# .NET API
Scanning Enhancement Tools (SET)
Hardware/OS Configuration Support
Native 32-bit library
Native 64-bit library

Wollen Sie im Wettbewerb Ihrer Konkurrenz immer voraus sein?
Wir helfen Ihnen gern!

Lizenzierungsmöglichkeiten

Die Lizenzoptionen des OmniPage SDK wurden mit besonderem Fokus auf die Anforderungen der Anwender gestaltet. Es werden keine Dongles benötigt. Folgende Lizenzen sind für Entwickler, um damit eigene Anwendungen zu erstellen. Für die Lizenzierungsoptionen und Preise der Runtime-Lizenzen zur Verteilung und Installation der entwickelten Anwendungen zusammen mit den erforderlichen OmniPage SDK-Komponenten senden Sie uns bitte eine kurze Anfrage über unsere Kontaktseite.

Basis-OCR-Kit

0
  • Entwicklerlizenz zur Installation des OmniPage Capture SDK. Enthält alle Module und mehrere Test-Runtime-Lizenzen, um entwickelte Anwendungen in der Zielumgebung zu testen.
    • C/C++/.NET-Bibliotheken für westeuropäische OCR
    • OCR-A, OCR-B, E-13B (MICR)
    • PDF-Technologie: PDF 1.7, PDF/A, PDF Normal, Nur-Bild-PDF, PDF mit Bild-über-Text sowie hohe PDF-MRC-Komprimierungsrate
    • Professional Visual Toolbox

Recognition Add-On

0
  • Add-On für erweiterte Dokument­verarbeitungs­technologien
    • Barcode
    • ICR
    • OMR
    • Form Template Editor
    • Document Classifier-Assistent

Asian Plus Add-On

0
  • Add-On für die zusätzliche Unterstützung asiatischer Sprachen.
    • Chinesisch (vereinfacht und traditionell)
    • Japanisch
    • Koreanisch
    • Arabisch
    • Thailändisch