
PDF-documenten zijn essentieel in veel zakelijke processen, vaak vereist programmatische toegang tot hun gescannelde inhoud. Het extraheren van tekst uit geschanke PDF bestanden kan uitdagend zijn, met de nadruk op de behoefte aan effectieve hulpmiddelen. In deze tutorial, zullen we onderzoeken hoe om OCR PDF documenten en extract tekst van PDF in C# met behulp van de betrouwbare Aspose.OCR voor .NET API, een toonaangevende C# OCR PDF extractie bibliotheek beschikbaar voor gratis evaluatie.
Wat je zal leren
In dit artikel zullen we de volgende onderwerpen bespreken:
- Overzicht van Aspose.OCR voor .NET API
- Stappen naar OCR PDF en Extract Text
- Hoe OCR op PDF te maken en tekst te bewaren
- Converteren OCR PDF naar Word
- Convert OCR PDF naar JSON
Overzicht van Aspose.OCR voor .NET API
Wij zullen gebruik maken van de Aspose.OCR voor .NET API, een robuste .NET PDF OCR API ontworpen om tekst te herkennen van gescannelde afbeeldingen, smartphone foto’s en screenshots, het retourneren van resultaten in verschillende documentformaat. Deze API converteert niet alleen beelden naar tekst, maar creëert ook zoekbare PDFs uit scans en corrigeert alle spellingfouten in de herkende text, waardoor het een van de snelste C# PDF oCR oplossingen beschikbaar voor slechts $99.
Het vuur bevat de AsposeOcr klasse, die meerdere methoden voor OCR-operaties biedt RecognizePdf(string, DocumentRecognitionSettings) methode is essentieel voor het extraheren van tekst uit een specifiek PDF-document DocumentRecognitionSettings De klas maakt de aanpassing van het herkenningsproces mogelijk, terwijl de RecognitionResult De klas encapsuleert de resultaten van de erkenning.
U kunt Download de DLL van de API of installeren via NuGet:
PM> Install-Package Aspose.OCR
Stappen naar OCR PDF en Extract Text in C#
Om OCR op PDF-documenten uit te voeren en de erkende tekst te extraheren, volg deze stappen:
- Maak een instantie van de AsposeOcr klasse.
- Initialiseren van een object in de DocumentRecognitionSettings klasse.
- Speel de taal voor OCR.
- Krijg het RecognitionResult door de Pdf()-methode aan te roepen, door het beeldpad en de DocumentRecognitionSettings Het object.
- Ga door de RecognitionResult-lijst om de geïdentificeerde tekst te tonen.
Hier is een voorbeeld die illustreert hoe om OCR PDF-documenten en te extraheren erkend tekst in C#:
OCR PDF en extract tekst uit PDF in C#
Hoe maak je OCR op PDF en bewaar tekst in C#
Om OCR op PDF-documenten uit te voeren en de erkende tekst te bewaren, volg deze stappen:
- Maak een instantie van de AsposeOcr klasse.
- Initialiseren van een object in de DocumentRecognitionSettings klasse.
- Speel de taal voor OCR.
- Bel de RecognizePdf()-methode om het RekognitionResult te krijgen.
- Speel de tekst met behulp van de SaveMultipageDocument()-methode, die de outputbestandpad vereist, de SaveFormat, en de RecognitionResult Het object.
Hier is een voorbeeld om te laten zien hoe u OCR PDF-documenten kunt opslaan en de erkende tekst in C# kunt bewaren#:
OCR uitvoeren op PDF en tekst opslaan in C#
Convert OCR PDF naar Word in C#
Om gescannelde PDF-documenten naar Word te converteren, volg dezelfde stappen als hierboven vermeld, maar voeg in de laatste stap SaveFormat.Docx aan.
Hier is een voorbeeld waarin wordt geïllustreerd hoe u OCR PDF kunt gebruiken en de herkende tekst als Word-document in C# kunt opslaan#:
OCR PDF en Convert Scanned PDF naar Word in C#
Convert OCR PDF naar JSON in C#
Om de geïdentificeerde tekst van PDF-documenten in een JSON-bestand te bewaren, volgt u de voorgaande stappen met de enige wijziging om SaveFormat.Json in de laatste stap te specificeren.
Hier is een voorbeeld om te laten zien hoe u OCR PDF kunt gebruiken en de herkenbare tekst als JSON-bestand in C# kunt opslaan#:
Krijg een gratis beoordelingsvergunning
U kunt Krijg een gratis tijdelijke licentie om de Aspose.OCR voor .NET API zonder enige beperkingen te beoordelen.
Conclusie
In deze tutorial hebben we geleerd hoe we OCR op PDF-documenten kunnen uitvoeren en tekst uit PDF in C# kunnen extraheren TXT, DOCX, en JSON Voor meer informatie over de Aspose.OCR voor .NET API, raadpleeg de Documentatie. Als je vragen hebt, voel je vrij om naar ons te komen op onze Forum.
Zie ook
- Convert screenshot naar tekst met OCR in C#
- OCR Image to Text en Spelling Correction in C#
- Convert Scanned PDF naar Searchable PDF met OCR in C#
Door gebruik te maken van de Aspose.OCR voor .NET API, kunt u hoge nauwkeurigheid PDF OCR in C# implementeren voor verschillende toepassingen, waaronder C# Ocr Invoice verwerking en formulierbehandeling. Deze aanvaardbare .NET PDF O CR-oplossing is perfect voor ontwikkelaars die op doeltreffende wijze OCR PDF-capaciteiten willen integreren in hun applicaties.
Voor degenen die geïnteresseerd zijn in de C# OCR PDF-to-text-capaciteiten, is de integratie naadloos, waardoor efficiënte tekstextractie van verschillende documentformaten mogelijk is. U kunt ook de C# Convert PDF to-Text functionaliteit gebruiken om gemakkelijk te gaan met tekst extract van PDF’s, het maken van uw ontwikkelingsproces gladder.
Als u op zoek bent naar een Aspose OCR C# Example, dient deze gids als een uitgebreid hulpmiddel. Bovendien, voor intricate taken zoals C# API gebruik, deze tutorial omvat alle essentiële elementen die nodig zijn om effectief te beginnen.
Voor degenen die op zoek zijn naar beoordeling van de PDF SDK en documentverwerking software bedrijf Aspose op OCR PDFSDK, deze tutorial dient als een uitstekende uitgangspunt om zijn capaciteiten te begrijpen. of u nodig hebt een C# CCR DLL voor integratie of een** C# O CR tutorial** for guidance, vindt u alles wat je nodig heeft om de API effectief te gebruiken in uw projecten.
Bovendien, als u de C#-tekstrecognitie wilt gebruiken of de C# OCR-bibliotheek kunt gebruiken voor verschillende toepassingen, kunt u ook de functies verkennen die Aspose biedt om deze functionaliteiten te ondersteunen.De c# oCR PDF SDK-beoordeling is een uitstekende gelegenheid om de mogelijkheden van deze bibliotheek te experimenteren en ervoor te zorgen dat je de juiste oplossingen vindt voor uw behoeften.
Uiteindelijk, als u nodig hebt om text uit PDF in C# te extraheren, of gebruik van een OCR API C #, de C# OCR PDF-functies die beschikbaar zijn, zullen uw ontwikkelingsproces versnellen en de functionaliteit van uw applicatie verbeteren.