
PDF dokumenti su neophodni u mnogim poslovnim procesima, često zahtijevaju programski pristup njihovom skeniranom sadržaju. ekstrakcija teksta iz skeniranih PDF datoteka može biti izazovna, naglašavajući potrebu za učinkovitim alatima. u ovom tutorialu, istražit ćemo kako OCR PDF dokumente i izvlačiti tekst iz PDF-a u C# pomoću pouzdanog Aspose.OCR za .NET API, vodeća C# OCR PDF ekstrakcijska knjižnica dostupna za besplatnu ocjenu.
Što ćete naučiti
U ovom članku ćemo obuhvatiti sljedeće teme:
- Pregled Aspose.OCR za .NET API
- Koraki za OCR PDF i izvlačenje teksta
- Kako izvršiti OCR na PDF i sačuvati tekst
- Konverzija OCR PDF-a u Word
- Konvertiranje OCR PDF-a u JSON
Pregled Aspose.OCR za .NET API
Mi ćemo koristiti Aspose.OCR za .NET API, snažan .NET PDF OCR API dizajniran za prepoznavanje teksta od skeniranih slika, pametnih fotografija i snimaka zaslona, vraćajući rezultate u različitim formatima dokumenta. ova API ne samo da pretvara slike u tekst, već i stvara pretražive PDF-ove iz skeniranja i ispravlja bilo kakve pogreške u priznavanom tekstu, čineći ga jednim od najbržih C# PDF oCR rješenja dostupnih za samo $99.
Obilježavanje vatre sadrži AsposeOcr razred, koji pruža više metoda za operacije OCR-a Prepoznajte PDF (string, DocumentRecognitionSettings) Metoda je neophodna za uklanjanje teksta iz određenog PDF dokumenta DocumentRecognitionSettings razred omogućuje prilagodbu procesa prepoznavanja, dok je RecognitionResult Razred encapsulira rezultate priznavanja.
Možeš Slijedeći članakDLL API ili ga instalirati preko NuGet:
PM> Install-Package Aspose.OCR
Koraki za OCR PDF i ekstrakcija teksta u C# {# korake-to-ocr-pdf-and-extract-text-in-c}
Da biste izvršili OCR na PDF dokumentima i izvukli prepoznatljiv tekst, slijedite sljedeće korake:
- Stvorite primjer razreda AsposeOcr.
- Inicijalizirajte objekt u razredu DocumentRecognitionSettings.
- Zapišite jezik za OCR.
- Dobijte RecognitionResult pozivajući se na Pdf() metodu, prolazeći put slike i DocumentRecognitionSettings Objekt je.
- Prolazite kroz popis RecognitionResult kako biste prikazali identificirani tekst.
Ovdje je primjer koji ilustrira kako se OCR PDF dokumenti i izvlačiti prepoznatljiv tekst u C#:
OCR PDF i izvlači tekst iz PDF-a u C#
Kako izvršiti OCR na PDF i sačuvati tekst u C#
Da biste izvršili OCR na PDF dokumentima i sačuvali prepoznatljiv tekst, slijedite ove korake:
- Stvorite primjer razreda AsposeOcr.
- Inicijalizirajte objekt u razredu DocumentRecognitionSettings.
- Zapišite jezik za OCR.
- Pozovite RecognizePdf() metodu kako biste dobili Rezultat za prijavu.
- Sačuvajte tekst pomoću SaveMultipageDocument() metoda, koja zahtijeva put izlaska datoteke SaveFormat, I to je RecognitionResult Objekt je.
Ovdje je primjer koji pokazuje kako napraviti OCR PDF dokumente i sačuvati prepoznatljiv tekst u C#:
Učinite OCR na PDF i sačuvajte tekst u C#
Konvertiranje OCR PDF u Word u C#
Da biste pretvorili skenirane PDF dokumente u Word, slijedite iste korake kao što je navedeno ranije, ali navedite SaveFormat.Docx u posljednjem koraku.
Ovdje je primjer koji ilustrira kako OCR PDF i sačuvati prepoznatljiv tekst kao Word dokument u C#:
OCR PDF i pretvoriti skenirani PDF u Word u C#
Konvertiranje OCR PDF-a u JSON u C#
Da biste sačuvali prepoznatljiv tekst iz PDF dokumenata u JSON datoteci, slijedite prethodne korake s jedinom promjenom da navedete SaveFormat.Json u posljednjem koraku.
Ovdje je primjer koji pokazuje kako napraviti OCR PDF i sačuvati prepoznatljiv tekst kao JSON datoteku u C#:
Dobijte besplatnu licencu za ocjenjivanje
Možeš Dobiti besplatnu privremenu dozvolu ocjenjivati Aspose.OCR za .NET API bez ograničenja.
zaključak
U ovom tutorialu naučili smo kako izvršiti OCR na PDF dokumentima i izvesti tekst iz PDF-a u C TXT, DOKX, i JSON Za više informacija o Aspose.OCR za .NET API, provjerite njegovu dokumentacija. Ako imate bilo kakvih pitanja, osjećajte se slobodno doći do nas na našem forum.
Vidjeti također
- Konvertirati snimke zaslona u tekst s OCR-om u C#
- OCR Image to Text i Spelling korekcija u C#
- Konvertiranje skeniranog PDF-a u pretraživog PDF-a s OCR-om u C#
Koristeći Aspose.OCR za .NET API, možete implementirati visoku točnost PDF OCR u C# za različite aplikacije, uključujući C# oCR Invoice obrađivanje i rukovanje obrazacima. ovo preporučljivo rješenje .NET PDF O CR je savršeno za razvijalce koji žele učinkovito integrirati OCr PDF kapacitete u svoje primjene.
Osim toga, ako trebate konvertirati PDF na tekst u C#, ova API pruža jednostavno rješenje. za one zainteresirane za C# OCR PDF u tekst sposobnosti, integracija je bespomoćna, omogućavajući učinkovitu ekstrakciju teksta iz različitih formata dokumenata. također možete koristiti c# Convert PDF to Text funkciju kako biste lako upravljali tekstom iz PDF-a, što će učiniti vaš razvojni proces glatkim.
Ako tražite Aspose OCR C# Example, ovaj vodič služi kao sveobuhvatni resurs. osim toga, za zanimljive zadatke kao što je C# API upotreba, ova tutorial obuhvaća sve bitne elemente potrebne za učinkovito početak.
Za one koji žele procijeniti PDF SDK i softversku tvrtku za obradu dokumenata Aspose na OCR PDFSDK, ovaj tutorial služi kao izvrsna točka početka kako bi razumjeli njegove sposobnosti.
Osim toga, ako želite iskoristiti C# prepoznavanje teksta ili koristiti c# OCR knjižnicu za različite aplikacije, možete istražiti značajke koje Aspose nudi kako bi podržala ove funkcije.
Konačno, ako trebate izvoditi tekst iz PDF-a u C#, ili koristiti OCR API C # , dostupne funkcije C# OCR PDF će ubrzati proces razvoja i poboljšati funkcionalnost vaše aplikacije.