
Documentele PDF sunt esențiale în multe procese de afaceri, care necesită adesea acces programatic la conținutul lor scanat. Extractarea textului din fișierele scrise PDF poate fi provocatoare, subliniind nevoia de instrumente eficiente. În acest tutorial, vom explora cum să obțineți documente PDF și să extrageți text din PDF în C# folosind fiabilitatea Aspose.OCR pentru .NET API, o bibliotecă de extracție PDF **C# OCR **disponibilă pentru evaluare gratuită.
Ce vei învăța
În acest articol vom acoperi următoarele subiecte:
- Aspose.OCR pentru .NET API
- Pasuri către OCR PDF și Extract Text
- Cum să efectuați OCR pe PDF și să salvați textul
- Convertirea OCR PDF în Word
- Conversie OCR PDF în JSON
Aspose.OCR pentru .NET API
Vom folosi de Aspose.OCR pentru .NET API, o API robustă .NET PDF OCR concepută pentru a recunoaște textul din imaginile scanate, fotografiile de smartphone și ecranele, returnând rezultatele în diferite formate de document. Această API nu numai că convertează imagini în text, ci și creează PDF-uri care pot fi căutate din scane și corectează orice greșeli de înregistrare în Textul recunoscut, făcându-l una dintre cele mai rapide C# PDF soluții de ocre disponibile pentru doar $99.
Incendiul prezintă AsposeOcr clasă, care oferă mai multe metode pentru operațiunile OCR RecognizePdf(string, Setări de recunoaștere a documentelor) metoda este esențială pentru extragerea textului dintr-un document PDF specificat DocumentRecognitionSettings clasa permite personalizarea procesului de recunoaştere, în timp ce RecognitionResult Clasa încorporează rezultatele recunoaşterii.
Puteţi Descărcați DLL de la API sau să o instaleze prin NuGet:
PM> Install-Package Aspose.OCR
Pasuri către OCR PDF și Extract Text în C#
Pentru a efectua OCR pe documentele PDF și pentru a extrage textul recunoscut, urmați următoarele pași:
- Creați o instanță a clasei AsposeOcr.
- Inițializați un obiect din clasa DocumentRecognitionSettings.
- Specificați limba pentru OCR.
- Obțineți RecognitionResult prin invocarea metodei Pdf(), trecând drumul imaginii și DocumentRecognitionSettings Obiectul.
- Mergeți prin lista RecognitionResult pentru a afișa textul identificat.
Iată un exemplu care ilustrează cum să obțineți documente PDF OCR și să extrageți textul recunoscut în C#:
OCR PDF și extrage text din PDF în C#
Cum să efectuați OCR pe PDF și să salvați text în C#
Pentru a efectua OCR pe documentele PDF și pentru a salva textul recunoscut, urmați următoarele pași:
- Creați o instanță a clasei AsposeOcr.
- Inițializați un obiect din clasa DocumentRecognitionSettings.
- Specificați limba pentru OCR.
- Apelați metoda RecognizePdf() pentru a obține Rezultatul recunoașterii.
- Salvați textul folosind metoda SaveMultipageDocument(), care necesită calea de ieșire a fișierului SaveFormat, şi a RecognitionResult Obiectul.
Iată un exemplu care demonstrează cum să obțineți documente PDF și să salvați textul recunoscut în C#:
Faceți OCR pe PDF și salvați textul în C#
Convertarea OCR PDF în Word în C#
Pentru a converti documentele PDF scanate în Word, urmați aceleași pași cum au fost descrise mai devreme, dar specificați SaveFormat.Docx în pasul final.
Iată un exemplu care ilustrează cum să accesați OCR PDF și să salvați textul recunoscut ca document Word în C#:
OCR PDF și Convertirile scanate PDF în Word în C#
Convertarea OCR PDF la JSON în C#
Pentru a salva textul recunoscut din documentele PDF într-un fișier JSON, urmați pașii anterioare, cu singura schimbare fiind să specificați SaveFormat.Json în pasul final.
Iată un exemplu care demonstrează cum să obțineți OCR PDF și să salvați textul recunoscut ca fișier JSON în C#:
Obțineți o licență de evaluare gratuită
Puteţi Obțineți o licență temporară gratuită pentru a evalua Aspose.OCR pentru .NET API fără restricții.
concluziile
În acest tutorial, am învățat cum să efectuați OCR pe documente PDF și să extrageți text din PDF în C TXT, DOCX, şi JSON Pentru mai multe informații despre Aspose.OCR pentru .NET API, verificați Documentare. Dacă aveți întrebări, simțiți-vă liberi să ajungeți la noi pe site-ul nostru Forumul.
Vezi și
- Convertați imaginea de ecran în text cu OCR în C#
- Imaginea OCR pentru corectarea textului și a spelling-ului în C#
- Convertați PDF scanat în PDF căutat cu OCR în C#
Prin utilizarea Aspose.OCR pentru API .NET, puteți implementa o precizie ridicată PDF OCR în C# pentru diferite aplicații, inclusiv C# Procesarea facturilor și prelucrarea formularelor. Această soluție de Dreptățită .NET PDF O CR este perfectă pentru dezvoltatorii care doresc să integreze eficient capacitățile OCR PDF la aplicațiile lor.
În plus, dacă aveți nevoie să convertiți PDF în text în C#, această API oferă o soluție simplă. Pentru cei interesați de C# OCR PDF la text capacitățile, integrarea este ușoară, permițând extracția eficientă a textului din diferite formate de document. De asemenea, puteți folosi funcționalitatea c# Convert PDF to Text pentru a gestiona cu ușurință extractul de text din PDF, făcând procesul dvs. de dezvoltare mai sofisticat.
Dacă sunteți în căutarea unui Aspose OCR C# Example, acest ghid servește ca o resursă cuprinzătoare. În plus, pentru sarcini complexe, cum ar fi C# API utilizare, prezentul tutorial acoperă toate elementele esențiale necesare pentru a începe în mod eficient.
Pentru cei care doresc să evalueze SDK-ul PDF și compania de software de prelucrare a documentelor Aspose pe OCR PDFSDK, acest tutorial servește ca un punct de plecare excelent pentru a înțelege capacitățile sale. fie că aveți nevoie de un C# O CR DLL pentru integrare sau un** C# oCR tutorial** de ghidare, veți găsi tot ce trebuie să utilizați în mod eficient API în proiectele dvs.
În plus, dacă doriți să utilizați recunoașterea textului C# sau să folosiți biblioteca OCR pentru diverse aplicații, puteți explora caracteristicile pe care Aspose le oferă pentru a sprijini aceste funcții. Avaliația SDK PDF este o oportunitate excelentă de a experimenta cu capacitățile acestei biblioteci, asigurându-vă că găsiți soluțiile potrivite pentru nevoile dvs.
În cele din urmă, dacă aveți nevoie să extrageți text din PDF în C# sau să utilizați un API OCR C #, caracteristicile disponibile C# OCR PDF vă vor simplifica procesul de dezvoltare și va îmbunătăți funcționalitatea aplicației.