
PDF dokumenti ir būtiski daudzos uzņēmējdarbības procesos, bieži vien nepieciešama programmatiskā piekļuve skenētajam saturam. Teksta ekstrakcija no skenētiem PDF failiem var būt izaicinoša, uzsverot vajadzību pēc efektīviem instrumentiem. Šajā apmācībā mēs izpētīsim kādā veidā iegūt OCR PDF dokumentus un izrakstīt tekstu no PDF C# , izmantojot uzticamu ASPOSE.OCR par .NET API, vadošā C# OCR PDF ekstrakcijas bibliotēka pieejama bezmaksas novērtēšanai.
Ko jūs uzzināsiet
Šajā rakstā mēs aptveram šādas tēmas:
- Aspose.OCR pārskats par .NET API
- Kļūstiet uz OCR PDF un ekstrakts teksts
- Kā veikt OCR uz PDF un saglabāt tekstu
- Konvertēt OCR PDF uz Word
- Konvertēt OCR PDF uz JSON
Apskats par Aspose.OCR .NET API
Mēs izmantosim šo ASPOSE.OCR par .NET API, spēcīgs **.NET PDF OCR API ** , kas ir izstrādāts, lai atpazītu tekstu no skenētiem attēliem, smartfon fotogrāfijām un ekrāna ierašanās, atgriežot rezultātus dažādos dokumentu formātos. Šī API ne tikai konvertē attēlus uz tekstu, bet arī izveido meklējamas PDF no skanēm un labo jebkādus atlases kļūdas atzītajā tekstā, padarot to par vienu no ātrākajiem **C# PDFOCR risinājumiem ** pieejamiem tikai $99 .
Ugunsgrēks ietver AsposeOcr klases, kas nodrošina vairākas metodes OCR darbībām. RecognizePdf(string, DocumentRecognitionSettings) metode ir nepieciešama, lai iegūtu tekstu no noteikta PDF dokumenta. DocumentRecognitionSettings klases ļauj personalizēt atpazīšanas procesu, bet RecognitionResult Klases iekapsulē atzīšanas rezultātus.
Jūs varat Lejupielādēt API DLL vai uzstādīt caur NuGet:
PM> Install-Package Aspose.OCR
Sēdes uz OCR PDF un ekstrakts teksts C#
Lai veiktu OCR uz PDF dokumentiem un ekstraktu atzītu tekstu, sekojiet šādiem soļiem:
- Izveidojiet AsposeOcr klases instanci.
- Izveidojiet objektu DokumentRecognitionSettings klasē.
- Nosakiet OCR valodu.
- Iegūstiet **RecognitionResult ** , ievadot Pdf() metodi, pāriet attēla maršrutam un DocumentRecognitionSettings Par objektu.
- Iet caur RecognitionResult sarakstu, lai parādītu identificēto tekstu.
Šeit ir piemērs, kas ilustrē kā uz OCR PDF dokumentiem un ekstrakts atzīts teksts C# :
OCR PDF un ekstrakts teksts no PDF C#
Kā veikt OCR uz PDF un saglabāt tekstu C#
Lai veiktu OCR uz PDF dokumentiem un saglabātu atzīto tekstu, sekojiet šādiem soļiem:
- Izveidojiet AsposeOcr klases instanci.
- Izveidojiet objektu DokumentRecognitionSettings klasē.
- Nosakiet OCR valodu.
- Sazinieties ar **RecognizePdf() ** metodi, lai iegūtu Rezultātu .
- Saglabājiet tekstu, izmantojot SaveMultipageDocument() metodi, kas prasa izejas faila ceļu, SaveFormat, un tā RecognitionResult Par objektu.
Šeit ir piemērs, kas parāda kā uz OCR PDF dokumentiem un glabā atzīto tekstu C# :
Izpildiet OCR uz PDF un saglabājiet tekstu C#
Konvertējot OCR PDF uz Word C#
Lai pārvērstu skanētos PDF dokumentus Word, sekojiet tiem pašiem soļiem, kā iepriekš norādīts, bet pēdējā posmā norādiet SaveFormat.Docx .
Šeit ir piemērs, kas ilustrē kā uz OCR PDF un glabāt atzīto tekstu kā Word dokumentu C# :
OCR PDF un konvertēt skenētu PDF uz Word C#
Konvertējot OCR PDF uz JSON C#
Lai saglabātu atpazīto tekstu no PDF dokumentiem JSON failā, sekojiet iepriekšējiem soļiem ar vienīgo izmaiņu ir norādīt SaveFormat.Json pēdējā posmā.
Šeit ir piemērs, kas parāda kā uz OCR PDF un glabāt atzīto tekstu kā JSON failu C# :
Iegūstiet bezmaksas novērtēšanas licenci
Jūs varat Iegūt bezmaksas pagaidu licences novērtēt Aspose.OCR .NET API bez jebkādiem ierobežojumiem.
Conclusion
Šajā apmācībā mēs uzzinājām, kā veikt OCR uz PDF dokumentiem un ekstraktu tekstu no PDF C#. TXT, DOCXun JSON Lai iegūtu vairāk informācijas par Aspose.OCR .NET API, pārbaudiet to DokumentācijaJa jums ir kādi jautājumi, jūtaties brīvi sasniegt mums uz mūsu Forums.
Skatīt arī
- Konvertēt ekrāna attēlu tekstā ar OCR C#
- OCR attēls uz teksta un spelling korekcija C#
- Konvertēt skenētu PDF uz meklējamu PDF ar OCR C#
Izmantojot **Aspose.OCR for .NET API ** , jūs varat īstenot augstu precizitāti **PDF OCR ** C# dažādām lietojumprogrammām, ieskaitot **C# Faturēšana un veidlapas apstrāde. Šis ** apmierinošs .Net PDF O CR risinājums ir ideāls izstrādātājiem, kuri vēlas efektīvi integrēt ** OCr PDF spējas savā programmā.
Turklāt, ja jums ir nepieciešams **konvertēt PDF uz tekstu C# ** , šī API nodrošina vienkāršu risinājumu. tiem, kas interesējas par C# OCR PDF tekstam iespējām, integrācija ir bezjēdzīga, ļaujot efektīvu teksta ekstrakciju no dažādiem dokumentu formātiem.
Ja jūs meklējat **Aspose OCR C# piemērs ** , šis rokasgrāmata kalpo kā visaptverošs resurss. Turklāt, lai veiktu sarežģītus uzdevumus, piemēram, C#OCR API izmantošanu, šī apmācība aptver visus būtiskos elementus, kas nepieciešami efektīvi sākt.
Tiem, kas vēlas **izvērtēt PDF SDK un dokumentu apstrādes programmatūru kompānija Aspose uz OCR PDFSDK ** , šis apmācība kalpo kā lielisks sākuma punkts, lai saprastu tās spējas. Vai jums ir nepieciešams C# CCR DLL ** integrācijai vai ** C# O CR apmiņas vadībai, jūs atradīsiet visu, ko jums nepieciešams efektīvi izmantot API jūsu projektos.
Turklāt, ja vēlaties izmantot C# teksta atpazīšanu vai izmantot*C # OCR bibliotēku** dažādām lietojumprogrammām, varat izpētīt funkcijas, ko Aspose piedāvā, lai atbalstītu šīs funkcionalitātes.
Visbeidzot, ja jums ir nepieciešams **izņemt tekstu no PDF C# ** vai izmantot **OCR API C # ** , pieejamās C# OCR PDF funkcijas vienkāršīs jūsu izstrādes procesu un uzlabos jūsu lietojumprogrammas funkcionalitāti.