
PDF-Dokumente sind in vielen Geschäftsprozessen von wesentlicher Bedeutung, die oft einen programmatischen Zugang zu ihrem scannierten Inhalt erfordern. Text aus scannen PDF Dateien zu extrahieren kann herausfordernd sein, wobei die Notwendigkeit effektiver Tools betont wird. In diesem Tutorial werden wir untersuchen wie zu OCR PDF Dokumente und Texte aus PDF in C# mit den zuverlässigen Aspose.OCR für .NET API, eine führende C# OCR PDF-Extraktionsbibliothek für kostenlose Bewertung verfügbar.
Was du lernen wirst
In diesem Artikel werden wir die folgenden Themen abdecken:
- Überblick über Aspose.OCR für .NET API
- Schritte zu OCR PDF und Text extrahieren
- Wie man OCR auf PDF durchführt und Text speichert
- Umwandeln OCR PDF in Word
- Umwandeln OCR PDF in JSON
berblick über Aspose.OCR für .NET API
Wir werden die Aspose.OCR für .NET API, .
Das Feuer enthält die AsposeOcr Klasse, die mehrere Methoden für OCR-Transaktionen bietet RecognizePdf (String, DokumentRecognitionSettings) Methode ist unerlässlich, um Text aus einem bestimmten PDF-Dokument zu extrahieren DocumentRecognitionSettings Klasse ermöglicht die Anpassung des Anerkennungsprozesses, während die RecognitionResult Die Klasse verfasst die Ergebnisse der Anerkennung.
Du kannst Download der DLL der API oder installieren Sie es über NuGet:
PM> Install-Package Aspose.OCR
Schritte zu OCR PDF und Text in C#
Um OCR auf PDF-Dokumenten durchzuführen und den anerkannten Text zu extrahieren, folgen Sie diesen Schritten:
- Erstellen Sie ein Beispiel der AsposeOcr Klasse.
- Initialisieren Sie ein Objekt der Klasse DocumentRecognitionSettings.
- Angeben Sie die Sprache für OCR.
- Erhalten Sie das RecognitionResult, indem Sie die Pdf() Methode anrufen und den Bildweg und die DocumentRecognitionSettings Das Objekt.
- Gehen Sie durch die RecognitionResult-Liste, um den identifizierten Text anzuzeigen.
Hier ist ein Beispiel, das illustriert wie OCR PDF-Dokumente und erkannte Text in C# extrahieren#:
OCR PDF und Text aus PDF in C#
Wie OCR auf PDF durchführen und Text in C# speichern
Um OCR auf PDF-Dokumenten durchzuführen und den anerkannten Text zu speichern, folgen Sie diesen Schritten:
- Erstellen Sie ein Beispiel der AsposeOcr Klasse.
- Initialisieren Sie ein Objekt der Klasse DocumentRecognitionSettings.
- Angeben Sie die Sprache für OCR.
- Rufen Sie die RecognizePdf() Methode an, um das RecognitionResult zu erhalten.
- Speichern Sie den Text mit der SaveMultipageDocument() Methode, die den Output-Dateiweg erfordert SaveFormat, und die RecognitionResult Das Objekt.
Hier ein Beispiel, das demonstriert wie zu OCR PDF-Dokumente und speichern Sie den anerkannten Text in C#:
OCR auf PDF ausführen und Text in C# speichern#
Konvertierung von OCR PDF in Word in C#
Um skannte PDF-Dokumente in Word zu konvertieren, folgen Sie den gleichen Schritten wie zuvor beschrieben, aber geben Sie im letzten Schritt SaveFormat.Docx an.
Hier ist ein Beispiel, das illustriert wie zu OCR PDF und speichern Sie den anerkannten Text als Word-Dokument in C#:
OCR PDF und Convert Scanned PDF in Word in C#
Konvertierung von OCR PDF in JSON in C#
Um erkannte Text aus PDF-Dokumenten in einer JSON-Datei zu speichern, folgen Sie den vorherigen Schritten mit der einzigen Änderung, um SaveFormat.Json im letzten Schritt zu angeben.
Hier ist ein Beispiel, das demonstriert wie zu OCR PDF und speichern Sie den anerkannten Text als JSON-Datei in C#:
Erhalten Sie eine kostenlose Bewertungslizenz
Du kannst Erhalten Sie eine freie vorübergehende Lizenz Um die Aspose.OCR für .NET API ohne Einschränkungen zu bewerten.
Schlussfolgerungen
In diesem Tutorial haben wir gelernt, wie wir OCR auf PDF-Dokumenten ausführen und Text aus PDF in C# extrahieren TXT, DOCX, und JSON Weitere Informationen zu Aspose.OCR für .NET API finden Sie unter Dokumentation. Wenn Sie Fragen haben, fühlen Sie sich frei, uns über unsere Forum.
Sehen Sie auch
- Umwandeln Sie Screenshot in Text mit OCR in C#
- OCR Image to Text und Spelling Correction in C#
- Konvertieren Scanned PDF in Searchable PDF mit OCR in C#
Durch die Nutzung der Aspose.OCR für .NET API, können Sie eine hohe Genauigkeit PDF OCR in C# für verschiedene Anwendungen implementieren, einschließlich der Verarbeitung und Formularbehandlung von C# O CR Invoice. Diese anwendbare .NET PDF Ocr-Lösung ist perfekt für Entwickler, die die OCR PDF-Fähigkeiten in ihre Anwendung effizient integrieren möchten.
Darüber hinaus, wenn Sie PDF in Text in C# konvertieren müssen, bietet diese API eine einfache Lösung. Für diejenigen, die an C# OCR PDF zu Text Fähigkeiten interessiert sind, ist die Integration unbequeme und ermöglicht eine effiziente Text-Extraktion aus verschiedenen Dokumentformaten. Sie können auch die Funktionalität C# Convert PDF to Text verwenden, um die Textextraction aus PDFs leicht zu handhaben, wodurch Ihr Entwicklungsverfahren sauberer wird.
Wenn Sie nach einem Aspose OCR C# Example suchen, dient dieser Leitfaden als umfassender Ressource. Zusätzlich, für intrikate Aufgaben wie der C# API-Nutzung, umfasst dieser Tutorial alle wesentlichen Elemente, die notwendig sind, effektiv zu beginnen.
Für diejenigen, die das PDF-SDK und Dokumentverarbeitungsoftware-Unternehmen Aspose auf OCR PDF SDK bewerten möchten, dient dieses Tutorial als ausgezeichnete Ausgangspunkt, um seine Fähigkeiten zu verstehen. Ob Sie eine C# DLL für die Integration benötigen oder ein C# OCD tutorials für Führung finden, finden Sie alles, was Sie brauchen, damit Sie die API in Ihren Projekten effektiv nutzen können.
Darüber hinaus, wenn Sie die C# Text-Erkennung nutzen oder dieC # OCR-Bibliothek für verschiedene Anwendungen nutzen möchten, können Sie den Features, die Aspose bietet, um diese Funktionen zu unterstützen, erforschen.
Schließlich, wenn Sie Text aus PDF in C# extrahieren müssen oder eine OCR API C # verwenden, werden die verfügbaren C# OCR PDF -Funktionen Ihren Entwicklungsvorgang vereinfachen und die Funktionalität Ihrer Anwendung verbessern. Sie können auch die Kennzeitschrift OCR für verschiedene ÖCR-Taschen nutzen, einschließlich Zu erkennen Text aus Image und Sample Implementierungen, um Ihre Projekte weiterzuentwickeln.