PDF-dokumenter er essensielle i mange forretningsprosesser, ofte som krever programmatisk tilgang til deres skannede innhold. Ekstraktering av tekst fra skannet PDF filer kan være utfordrende, understreker behovet for effektive verktøy. I denne veiledningen, vil vi utforske how to OCR PDF documents and extract text from PDF in C# using the reliable tools. Aspose.OCR for .NET API, en ledende C# OCR PDF ekstraksjonsbibliotek tilgjengelig for gratis evaluering.

Hva du vil lære

I denne artikkelen vil vi dekke følgende emner:

Oversikt over Aspose.OCR for .NET API

Vi vil bruke den Aspose.OCR for .NET API, en robust **.NET PDF OCR API ** designet for å gjenkjenne tekst fra skannede bilder, smarttelefonbilder og skjermbilder, returnerer resultater i ulike dokumentformat. Denne API konverterer ikke bare bilder til tekst, men skaper også søkbare PDF-er fra scanner og korrigerer eventuelle spellingfeil i den gjenkjente teksten, noe som gjør det til en av de raskeste **C# PDF oCR løsninger ** tilgjengelig for bare $99 .

Brannene inneholder AsposeOcr klass, som gir flere metoder for OCR-operasjoner. RecognizePdf (string, DocumentRecognitionSettings) Metoden er viktig for utvinning av tekst fra et spesifisert PDF-dokument. DocumentRecognitionSettings Klasse gjør det mulig å tilpasse anerkjennelsesprosessen, mens RecognitionResult Klassen encapsulerer resultatene av anerkjennelsen.

Du kan Last ned DLL av API eller installere den via NuGet:

PM> Install-Package Aspose.OCR

Trinn til OCR PDF og Ekstrakt tekst i C#

For å utføre OCR på PDF-dokumenter og trekke ut den anerkjente teksten, følg disse trinnene:

  • Skap en instans av AsposeOcr klassen.
  • Initialiser et objekt i klassen DocumentRecognitionSettings .
  • Angi språket for OCR.
  • Få **RecognitionResult ** ved å ringe til Pdf() -metoden, passere bildeveien og DocumentRecognitionSettings og objektet.
  • Gå gjennom RecognitionResult -listen for å vise den identifiserte teksten.

Her er et eksempel som illustrerer hvis OCR PDF-dokumenter og ekstrakter anerkjent tekst i C# :

OCR PDF og Ekstrakte tekst fra PDF i C#

Hvordan utføre OCR på PDF og lagre tekst i C#

For å utføre OCR på PDF-dokumenter og lagre den anerkjente teksten, følg disse trinnene:

  • Skap en instans av AsposeOcr klassen.
  • Initialiser et objekt i klassen DocumentRecognitionSettings .
  • Angi språket for OCR.
  • Ring **RecognizePdf() ** for å få RekognitionResult .
  • Lagre teksten ved hjelp av SaveMultipageDocument() -metoden, som krever utgangsfilveien, SaveFormat, og den RecognitionResult og objektet.

Her er et eksempel som viser hvis å OCR PDF-dokumenter og lagre den anerkjente teksten i C# :

Utføre OCR på PDF og lagre tekst i C#

Konverter OCR PDF til Word i C#

For å konvertere skannede PDF-dokumenter til Word, følg de samme trinnene som oppgitt tidligere, men angi SaveFormat.Docx i det siste steget.

Her er et eksempel som illustrerer hvis å OCR PDF og lagre den anerkjente teksten som et Word-dokument i C# :

OCR PDF og konvertere skannede PDF til Word i C#

Konverter OCR PDF til JSON i C#

For å lagre gjenkjent tekst fra PDF-dokumenter i en JSON-fil, følg de foregående trinnene med den eneste endringen som er å angi SaveFormat.Json i det siste steget.

Her er et eksempel som viser hvis å OCR PDF og lagre den anerkjente teksten som en JSON-fil i C# :

Få en gratis evalueringslisens

Du kan Få gratis midlertidig lisens å evaluere Aspose.OCR for .NET API uten noen begrensninger.

Conclusion

I denne veiledningen lærte vi hvordan du utfører OCR på PDF-dokumenter og ekstrakter tekst fra PDF i C#. TXT, DOCX, og JSON For mer informasjon om Aspose.OCR for .NET API, sjekk ut DokumentasjonHvis du har noen spørsmål, føl deg fri til å nå ut til oss på vår Forumet.

Se også

Ved å bruke **Aspose.OCR for .NET API ** , kan du implementere høy nøyaktighet **PDF OCR ** i C# for ulike applikasjoner, inkludert **C# OCR Invoice ** behandling og formhåndtering. Denne **forbedringsfylte .Net PDF OKR-løsningen ** er perfekt for utviklere som ønsker å integrere OKR PDF kapasiteter i sine programmer effektivt.

I tillegg, hvis du trenger å **konvertere PDF til tekst i C# ** , gir denne API en enkel løsning. For de som er interessert i **C# OCR PDF for tekst ** funksjoner, er integrasjonen sømløs, slik at du kan effektivt tekstutvinning fra ulike dokumentformater. Du kan også bruke c# Convert PDF to Text -funksjonaliteten for å enkelt håndtere tekstudveksling fra PDF-er, noe som gjør utviklingsprosessen smalere.

Hvis du leter etter en **Aspose OCR C# Example ** , tjener denne guiden som en omfattende ressurs. Dessuten, for komplekse oppgaver som C# API bruk, dekker denne veiledningen alle de grunnleggende elementene som trengs for å komme i gang effektivt.

For de som ønsker å *vurderer PDF SDK og dokumentbehandlings programvare selskapet Aspose på OCR PDFSDK ** , tjener denne tutorialen som en utmerket utgangspunkt for å forstå dens evner. Uansett om du trenger en C# O CR DLL ** for integrasjon eller et C# oCR tutorial for veiledning, vil du finne alt du behøver å effektivt bruke API i dine prosjekter.

Videre, hvis du ønsker å utnytte C#-tekstkjenning ** eller bruke ** C# OCR-biblioteket for ulike applikasjoner, kan du utforske funksjonene Aspose tilbyr for å støtte denne funksjonen.

Endelig, hvis du trenger å **ekstrakte tekst fra PDF i C# ** , eller bruke en **OCR API C # ** , vil de C# OCR PDF funksjonene som er tilgjengelige raskere utviklingsprosessen din og forbedre applikasjonsfunksjonaliteten.

More in this category