Die Automatisierung von Dateninnahmen aus scannen oder fotografierten Formularen kann die Produktivität und Genauigkeit in verschiedenen Branchen, wie Gesundheitsversorgung, Finanzen und juristische Dienstleistungen erhöhen. Aspose.OCR für .NET bietet eine leistungsfähige Lösung, um diesen Prozess zu automatisieren, indem Sie Bilder des Textes in bearbeitbare Textformate umwandeln. Dieser Blog-Post wird Sie durch die Schritte führen, die erforderlich sind, aufzustellen und zu verwenden Asposa.ocR for .Net Daten aus Formulare effizient zu extrahieren.

Vollständiges Beispiel

Um einen schnellen Start zu erhalten, finden Sie hier einen Überblick darüber, wie Sie Dateninnahmen mit Aspose.OCR für .NET automatisieren können:

  • Laden Sie die Form Bild.
  • Konfigurieren Sie die OCR-Einstellungen für eine optimale Erkennung.
  • Text aus der Form abzuheben.
  • Exportieren Sie den anerkannten Text in das gewünschte Format.

Schritt für Schritt Guide

Schritt 1: Laden Sie das Bild des Formulars hoch

Der erste Schritt ist es, das geschanzte oder fotografierte Formular in Ihre Anwendung zu laden. Stellen Sie sicher, dass die Bildqualität hoch genug ist, um eine genaue OCR-Verarbeitung zu ermöglichen. Image Klasse zum Laden der Bilddatei.

Schritt 2: Konfigurieren von OCR-Einstellungen

Um die besten Ergebnisse zu erzielen, müssen Sie die OCR-Einstellungen entsprechend den Merkmalen Ihrer Formulare konfigurieren.Dies umfasst die Einstellung der Sprachunterstützung, die Anpassung des Kontrasts und der Glanz und die Angabe von Interessengebieten (ROI) für die Textekstraktion.

// Step 1: Load the form image
string imagePath = "path/to/your/form_image.png";
using (var image = new Aspose.Ocr.Image(imagePath))
{
    // Image is now loaded and ready for OCR processing
}

Schritt 3: Text aus der Form zu extrahieren

Sobald das Bild geladen ist und die Einstellungen konfiguriert sind, können Sie weiterhin Text aus dem Formular extrahieren. Aspose.OCR bietet Methoden zur Erkennung von Text in bestimmten Bereichen oder über das gesamte Bild.

// Step 2: Configure OCR Settings
var ocrEngine = new OcrEngine();
ocrEngine.Settings.Language = RecognitionLanguages.English;
ocrEngine.Settings.ContrastAdjustmentMode = ContrastAdjustmentMode.HighContrast;
ocrEngine.Settings.Brightness = 10;

Schritt 4: Export anerkannter Text

Nach der Extraktion des Textes möchten Sie es möglicherweise in ein Format exportieren, das für weitere Verarbeitung geeignet ist, wie CSV, JSON oder reiches Text. Aspose.OCR unterstützt verschiedene Ausgangsformate und ermöglicht es Ihnen, die Daten an Ihre Bedürfnisse anzupassen.

// Step 3: Extract text from the form
using (var ocrEngine = new OcrEngine())
{
    string extractedText = ocrEngine.RecognizeImage(imagePath);
    Console.WriteLine("Extracted Text:\n" + extractedText);
}

Beste Praktiken

Verwalten von Real-World Layouts

Real-World-Formulare haben oft komplexe Layouts mit unterschiedlichen Schriftarten und Größen.Um diese Herausforderungen effizient zu bewältigen, denken Sie an die Verwendung fortschrittlicher Funktionen wie benutzerdefinierte Wörterbuchungen für spezialisierte Terminologie oder die Einstellung mehrerer OCR Sprachen, wenn das Formular Text in unterschiedlicher Sprache enthält.

Exportoptionen

Wenn Sie anerkannte Texte exportieren, wählen Sie ein Ausgangsformat, das Ihrem Workflow am besten passt. Zum Beispiel ist CSV ideal für Tabelldaten, während JSON besser für strukturierte Daten mit Nested-Objekten ist.

Durch die Folge dieser Schritte und Best Practices können Sie effizient Dateninnahmen aus scannen oder fotografierten Formularen mit Aspose.OCR für .NET automatisieren.Dies spart nicht nur Zeit, sondern verringert auch das Risiko von Fehlern im Zusammenhang mit manueller Datenaufnahme.

More in this category