OCR PDF ir teksto ekstraktas iš PDF C# naudojant Aspose.OCR .NET API | File Format Processing Plugins for C# .NET Core

PDF dokumentai yra būtini daugelyje verslo procesų, dažnai reikalauja programinės prieigos prie jų skenuojamo turinio. teksto ekstrakcija iš skanintų PDF failų gali būti sudėtinga, pabrėžiant poreikį efektyviems įrankiams. Šiame mokymo programoje mes išnagrinėsime kaip gauti OCR PDF dokumentus ir tekstą iš PDF C# naudojant patikimą Aspose.OCR už .NET API, pirmaujanti C# OCR PDF ekstrakcijos biblioteka , kurią galima nemokamai įvertinti.

Ką išmoksite

Šiame straipsnyje mes apimsime šias temas:

Apžvalga Aspose.OCR .NET API

Mes pasinaudosime Aspose.OCR už .NET API, tvirtas **.NET PDF OCR API ** sukurtas norint atpažinti tekstą iš nuskaitytų vaizdų, išmaniojo telefono nuotraukų ir ekranų nuotolių, grąžinant rezultatus įvairiais dokumentų formatais. Šis API ne tik konvertuoja vaizdus į tekstus, bet ir sukuria paieškos PDF iš skenavimo ir ištaisyti bet kokius įrašymo klaidas pripažintame tekste, todėl jis yra vienas greičiausių **C# PDF oCR sprendimų ** prieinamas tik 99.

Ugnis apibūdina AsposeOcr klasė, kuri siūlo daugybę OCR operacijų metodų RecognizePdf(string, DokumentasRecognitionSettings) metodas yra būtinas norint ištraukti tekstą iš tam tikro PDF dokumento DocumentRecognitionSettings klasė leidžia pritaikyti pripažinimo procesą, o RecognitionResult Klasė apibūdina pripažinimo rezultatus.

Jūs galite Atsisiųskite DLL iš API arba įdiegti per NuGet:

PM> Install-Package Aspose.OCR

Žingsniai į OCR PDF ir Ekstraktuoti tekstą C#

Norėdami atlikti OCR PDF dokumentuose ir ištraukti pripažintą tekstą, laikykitės šių žingsnių:

Sukurkite AsposeOcr klasės pavyzdį.
Pradėkite objektą DocumentRecognitionSettings klasėje.
Nustatykite OCR kalbą.
Gaukite **RecognitionResult ** skambindami Pdf() metodą, praeinant vaizdo maršrutą ir DocumentRecognitionSettings ir objektą.
Eikite per RecognitionResult sąrašą, kad pamatytumėte identifikuotą tekstą.

Štai pavyzdys, kuris iliustruoja kaip gauti OCR PDF dokumentus ir ištraukti pripažintą tekstą C#:

OCR PDF ir tekstas iš PDF C#

Kaip atlikti OCR PDF ir išsaugoti tekstą C#

Norėdami atlikti OCR PDF dokumentuose ir išsaugoti pripažintą tekstą, laikykitės šių žingsnių:

Sukurkite AsposeOcr klasės pavyzdį.
Pradėkite objektą DocumentRecognitionSettings klasėje.
Nustatykite OCR kalbą.
Skambinkite **RecognizePdf() ** metodą, kad gautumėte Rezultą.
Išsaugoti tekstą naudojant SaveMultipageDocument() metodą, kuri reikalauja išleidimo failų maršruto SaveFormat, Ir tai yra RecognitionResult ir objektą.

Štai pavyzdys, parodantis kaip įvesti OCR PDF dokumentus ir išsaugoti pripažintą tekstą C#:

Atlikti OCR PDF ir išsaugoti tekstą C#

Konvertuoti OCR PDF į Word C#

Norėdami konvertuoti iššifruotus PDF dokumentus į Word, atlikite tuos pačius žingsnius, kaip nurodyta anksčiau, bet paskutiniame etape nurodykite SaveFormat.Docx.

Štai pavyzdys, kuris iliustruoja kaip įvesti OCR PDF ir išsaugoti pripažintą tekstą kaip “Word” dokumentą C#:

OCR PDF ir konvertuoti Skanytą PDF į Word C#

Konvertuoti OCR PDF į JSON į C#

Norėdami išsaugoti pripažintą tekstą iš PDF dokumentų JSON faile, sekite ankstesnius žingsnius su vieninteliu pakeitimu, kad paskutiniame žengime nurodytumėte SaveFormat.Json.

Štai pavyzdys, parodantis kaip įvesti OCR PDF ir išsaugoti pripažintą tekstą kaip JSON failą C#:

Gaukite nemokamą vertinimo licenciją

Jūs galite Gaukite nemokamą laikiną licenciją įvertinti Aspose.OCR .NET API be jokių apribojimų.

Conclusion

Šioje mokymo programoje sužinojome, kaip atlikti OCR PDF dokumentuose ir iš PDF į C# ištraukti tekstą TXT, DOKX, ir JSON Norėdami gauti daugiau informacijos apie Aspose.OCR .NET API, patikrinkite dokumentacija. Jei turite kokių nors klausimų, jaustis laisvas pasiekti mus mūsų Forumas.

Taip pat žiūrėkite

Naudodamiesi Aspose.OCR .NET API , galite įgyvendinti aukštą tikslumą PDF OCR C# įvairioms programoms, įskaitant C#OCR sąskaitos apdorojimą ir formų tvarkymą. Šis Paprastas .Net PDF O CR sprendimas idealiai tinka kūrėjams, norintiems efektyviai integruoti OKR PDF pajėgumus į savo programas.

Be to, jei jums reikia **konvertuoti PDF į tekstą į C# ** , ši API suteikia paprastą sprendimą. Tiems, kurie domisi **C# OCR PDF prie teksto ** galimybėmis, integracija yra beprasmiška, leidžianti efektyvią teksto ekstrakciją iš įvairių dokumentų formatų. Taip pat galite naudoti funkciją K# Konvertavimas į PDF lengvai tvarkyti tekstinį ekstraktą iš PDF, kad jūsų plėtros procesas būtų sklandesnis.

Jei ieškote Aspose OCR C# pavyzdžio , šis vadovas tarnauja kaip visapusiškas išteklius. Be to, tokioms sudėtingoms užduotims, kaip C# API naudojimas, ši mokymo programa apima visus esmines elementus, reikalingus veiksmingai pradėti.

Tiems, kurie nori **vertinti PDF SDK ir dokumentų apdorojimo programinės įrangos bendrovė Aspose OCR PDFSDK ** , šis mokymo kursas tarnauja kaip puikus pradinis taškas suprasti jo gebėjimus. Nesvarbu, ar jums reikia C#OCR DLL ** integracijai ar ** C#OCR mokymosi kursą vadovavimui, rasite viską, ko reikia, kad efektyviai naudotumėte API savo projektus.

Be to, jei norite naudotis **C# teksto pripažinimu ** arba naudoti ** C# OCR biblioteką ** įvairioms programoms, galite ištirti funkcijas, kurias siūlo „Aspose“, kad palaikytumėte šias funkciją. c# oCR PDF SDK vertinimas yra puiki galimybė eksperimentuoti su šios bibliotekos gebėjimais, užtikrinant, kad rasite teisingus sprendimus jūsų poreikiams.

Galiausiai, jei jums reikia ekstratuoti tekstą iš PDF į C# arba naudoti OCR API C # , prieinamos C# OCR PDF funkcijos supaprastins jūsų plėtros procesą ir pagerins programos funkcionalumą.

Ką išmoksite#

Apžvalga Aspose.OCR .NET API#

Žingsniai į OCR PDF ir Ekstraktuoti tekstą C##

Kaip atlikti OCR PDF ir išsaugoti tekstą C##

Konvertuoti OCR PDF į Word C##

Konvertuoti OCR PDF į JSON į C##

Gaukite nemokamą vertinimo licenciją#

Conclusion#

Taip pat žiūrėkite#

More in this category