
I documenti PDF sono essenziali in molti processi aziendali, spesso che richiedono l’accesso programmatico al loro contenuto scansionato. Estratto di testo dai file PDF scandati può essere sfidante, sottolineando la necessità di strumenti efficaci. In questo tutorial, esploreremo come a documentari PDF OCR e estrarre il testo dal PDF in C# utilizzando il credibile Aspose.OCR per .NET API, una libreria di estrazione PDF **C# OCR **disponibile per la valutazione gratuita.
Cosa imparerai
In questo articolo parleremo dei seguenti argomenti:
- Visualizzazione di Aspose.OCR per .NET API
- Passaggi verso OCR PDF e Extract Text
- Come eseguire OCR su PDF e salvare testo
- Convertire OCR PDF in Word
- Convertire OCR PDF in JSON
Visualizza Aspose.OCR per .NET API
Utilizzeremo il Aspose.OCR per .NET API, .
Il fuoco è caratterizzato da AsposeOcr classe, che fornisce diversi metodi per le operazioni OCR RecognizePdf (string, DocumentRecognitionSettings) Il metodo è essenziale per l’estrazione del testo da un documento PDF specifico DocumentRecognitionSettings La classe consente la personalizzazione del processo di riconoscimento, mentre il RecognitionResult La classe incapsula i risultati del riconoscimento.
Tu puoi Scarica il DLL dell’API o l’installa tramite NuGet:
PM> Install-Package Aspose.OCR
Passaggi verso OCR PDF e Extract Text in C#
Per eseguire OCR su documenti PDF e estrarre il testo riconosciuto, seguire questi passaggi:
- Crea un esempio della classe AsposeOcr.
- Iniziare un oggetto della classe DocumentRecognitionSettings.
- Determinare il linguaggio per OCR.
- Ottieni il RecognitionResult invocando il metodo Pdf(), passando la strada dell’immagine e il DocumentRecognitionSettings Gli oggetti.
- Passare attraverso la lista RecognitionResult per visualizzare il testo identificato.
Ecco un esempio che illustra come ottenere i documenti PDF OCR ed estrarre il testo riconosciuto in C#:
OCR PDF e Testo estratto dal PDF in C#
Come eseguire OCR su PDF e salvare testo in C#
Per eseguire OCR su documenti PDF e salvare il testo riconosciuto, seguire questi passaggi:
- Crea un esempio della classe AsposeOcr.
- Iniziare un oggetto della classe DocumentRecognitionSettings.
- Determinare il linguaggio per OCR.
- Chiama il metodo RecognizePdf() per ottenere il RecognitionResult.
- Salva il testo utilizzando il metodo SaveMultipageDocument(), che richiede il percorso del file di uscita, il SaveFormat, e il RecognitionResult Gli oggetti.
Ecco un esempio che mostra come ottenere i documenti PDF OCR e salvare il testo riconosciuto in C#:
Eseguire OCR su PDF e salvare testo in C#
Convertire OCR PDF in Word in C#
Per convertire i documenti PDF scansionati in Word, seguire gli stessi passaggi come indicato in precedenza, ma specificare SaveFormat.Docx nella fase finale.
Ecco un esempio che illustra come accedere a OCR PDF e salvare il testo riconosciuto come documento Word in C#:
OCR PDF e Convertire Scannato PDF in Word in C#
Convertire OCR PDF a JSON in C#
Per salvare il testo riconosciuto da documenti PDF in un file JSON, seguire i passaggi precedenti con l’unico cambiamento è specificare SaveFormat.Json nella fase finale.
Ecco un esempio che mostra come accedere a OCR PDF e salvare il testo riconosciuto come file JSON in C#:
Ottieni una licenza di valutazione gratuita
Tu puoi Ottieni una licenza temporanea gratuita per valutare il Aspose.OCR per .NET API senza alcuna limitazione.
conclusione
In questo tutorial, abbiamo imparato come eseguire OCR su documenti PDF e estrarre testo dal PDF in C TXT, Il DOCX, e di JSON Per ulteriori informazioni sul Aspose.OCR per .NET API, verifica il suo Documentazione. Se avete domande, siate liberi di arrivare a noi Il forum.
Vedi anche
- Convertire screenshot in testo con OCR in C#
- Immagine OCR per il testo e la correzione di spelling in C#
- Convertire PDF scansionato in PDF di ricerca con OCR in C#
Utilizzando Aspose.OCR per .NET API, è possibile implementare l’alta precisione PDF OCR in C# per varie applicazioni, tra cui il trattamento e la manipolazione dei moduli di fatturazione C#.Questo disponibile soluzione oCR PDF è perfetto per gli sviluppatori che cercano di integrare efficacemente le capacità ocr pdf nelle loro applicative.
Inoltre, se hai bisogno di convertire PDF in testo in C#, questa API fornisce una soluzione semplice.Per coloro che sono interessati alle capacità C# OCR PDF a testo l’integrazione è senza sguardo, consentendo un’efficiente estrazione di testo da diversi formati di documento.Puoi anche utilizzare la funzionalità Convertito in formato PDF per gestire facilmente l’estrazione del testo dai PDF, rendendo il tuo processo di sviluppo più flessibile.
Se stai cercando un Aspose OCR C# Example, questa guida serve come una risorsa completa.Inoltre, per compiti intriganti come C# API utilizzo, questo tutorial copre tutti gli elementi essenziali necessari per iniziare efficacemente.
Per coloro che cercano di valutare la società di software di elaborazione PDF SDK e documenti Aspose su OCR PDFSDK, questo tutorial funziona come un ottimo punto di partenza per comprendere le sue capacità. Che si tratti di un C# oCR DLL per l’integrazione o un C# orario per la guida, troverete tutto quello che è necessario per utilizzare efficacemente la API nei vostri progetti.
Inoltre, se si desidera sfruttare il riconoscimento del testo C# o utilizzare la libreria OCR per varie applicazioni, è possibile esplorare le caratteristiche che Aspose offre per supportare queste funzionalità.
Infine, se avete bisogno di estrattare testo dal PDF in C#, o utilizzare un OCR API C # , le funzionalità disponibili C# OCR PDF semplificeranno il vostro processo di sviluppo e miglioreranno la funzione dell’applicazione.