PDF dokumenty sú nevyhnutné v mnohých obchodných procesov, často vyžadujú programatický prístup k ich skenovanému obsahu. Odstránenie textu z skenovaných PDF súborov môže byť náročné, zdôrazňujúce potrebu efektívnych nástrojov. V tomto tutoriáli budeme preskúmať ako sa OCR PDF doklady a odstrániť text z PDF v C# pomocou spoľahlivého Aspose.OCR pre .NET API, popredná C# OCR PDF extrakcia knižnica k dispozícii pre bezplatnú hodnotenie.

Čo sa naučíte

V tomto článku sa budeme zaoberať nasledujúcimi témami:

Prehľad Aspose.OCR pre .NET API

Budeme používať Aspose.OCR pre .NET API, robustný .NET PDF OCR API navrhnutý tak, aby rozpoznal text zo skenovaných obrázkov, smartfónových fotografií a snímok obrazovky, vrátia výsledky v rôznych formátoch dokumentu. Táto API nielen konvertuje obrázky do textu, ale tiež vytvára vyhľadávateľné PDF z skenovania a opravuje akúkoľvek chybu v zaznamenanom texte, čo je jedným z najrýchlejších C# PDF oCR riešení k dispozícii za len $99.

Oheň obsahuje AsposeOcr trieda, ktorá poskytuje viaceré metódy pre operácie OCR RecognizePdf(string, dokumentRecognitionNastavenia) metóda je nevyhnutná pre extrahovanie textu z konkrétneho PDF dokumentu DocumentRecognitionSettings trieda umožňuje prispôsobenie procesu uznávania, zatiaľ čo RecognitionResult trieda zakapsuluje výsledky uznania.

Môžeš Stiahnuť DLL z API alebo nainštalovať prostredníctvom NuGet:

PM> Install-Package Aspose.OCR

Krok do OCR PDF a extrahovať text v C#

Ak chcete vykonať OCR na PDF dokumentoch a extrahovať uznaný text, postupujte podľa týchto krokov:

  • Vytvorte príklad triedy AsposeOcr.
  • Initializujte objekt v triede DokumentRecognitionSettings.
  • Zadajte jazyk pre OCR.
  • Získajte RecognitionResult zavádzaním metódy RekognizePdf(), prechádzajúc obrazovou trasou a DocumentRecognitionSettings na objekty.
  • Prejdite cez zoznam RecognitionResult a zobrazte identifikovaný text.

Tu je príklad, ktorý ilustruje ako sa OCR PDF dokumenty a extrahovať uznávaný text v C#:

OCR PDF a extrahovať text z PDF v C#

Ako vykonávať OCR na PDF a uložiť text v C#

Ak chcete vykonať OCR na PDF dokumentoch a uložiť uznaný text, postupujte podľa týchto krokov:

  • Vytvorte príklad triedy AsposeOcr.
  • Initializujte objekt v triede DokumentRecognitionSettings.
  • Zadajte jazyk pre OCR.
  • Zavolajte RecognizePdf() metódu, aby ste získali Rezultát pre poznanie.
  • Uložiť text pomocou metódy SaveMultipageDocument(), ktorá vyžaduje cestu výstupného súboru SaveFormat, a to aj s RecognitionResult na objekty.

Tu je príklad ukázať ako sa OCR PDF dokumenty a uložiť uznaný text v C#:

Vykonávať OCR na PDF a uložiť text v C#

Konvertovanie OCR PDF na Word v C#

Ak chcete previesť naskenované PDF dokumenty do programu Word, postupujte podľa tých istých krokov, ako bolo uvedené skôr, ale v konečnom kroku uveďte SaveFormat.Docx.

Tu je príklad, ktorý ilustruje ako sa OCR PDF a uložiť uznaný text ako Word dokument v C#:

OCR PDF a Convert Scanned PDF to Word v C#

Konvertovanie OCR PDF na JSON v C#

Ak chcete uložiť uznávaný text z dokumentov PDF v súbore JSON, postupujte podľa predchádzajúcich krokov s jedinou zmenou, aby ste v konečnom kroku uviedli SaveFormat.Json.

Tu je príklad ukázať ako sa OCR PDF a uložiť uznaný text ako JSON súbor v C#:

Získajte bezplatnú hodnotenie

Môžeš Získajte bezplatnú dočasnú licenciu vyhodnotiť Aspose.OCR pre .NET API bez akýchkoľvek obmedzení.

Záver

V tomto tutoriáli sme sa dozvedeli, ako vykonávať OCR na PDF dokumentoch a extrahovať text z PDF v C TXT, DOKX, a JSON Pre viac informácií o Aspose.OCR pre .NET API, skontrolujte jeho dokumentácia. Ak máte akékoľvek otázky, cítite sa slobodne k nám prichádzať na našich Fórum.

Pozri tiež

Používaním Aspose.OCR pre .NET API môžete implementovať vysokú presnosť PDF OCR v C# pre rôzne aplikácie, vrátane spracovania C# O CR faktúry a manipulácie s formulármi. Toto výhodné riešenie .NET PDF Ocr je ideálne pre vývojárov, ktorí chcú efektívne integrovať OCR PDF schopnosti do svojich aplikácií.

Okrem toho, ak potrebujete konvertovať PDF do textu v C#, táto API poskytuje jednoduché riešenie. Pre tých, ktorí sa zaujímajú o C# OCR PDF na text schopnosti, integrácia je bezproblémová, čo umožňuje efektívnu textovú extrakciu z rôznych formátov dokumentu. Môžete tiež použiť funkciu Convert PDF to Text na ľahké zaobchádzanie s textovou extraciou z PDF, čím sa váš vývojový proces vylepšuje.

Ak hľadáte Aspose OCR C# Example, tento sprievodca slúži ako komplexný zdroj. Okrem toho, pre zaujímavé úlohy, ako je C# API použitie, táto príručka pokrýva všetky základné prvky potrebné na efektívne začatie. Navyše, ak chcete extract text z PDF pomocou C # , schopnosti API Aspose oCR výrazne zvýši vaše pracovné toky.

Pre tých, ktorí chcú hodnotiť PDF SDK a softvérovú spoločnosť na spracovanie dokumentov Aspose na OCR PDFSDK, tento výukový program slúži ako vynikajúci východiskový bod na pochopenie jeho schopností. Či už potrebujete C# DLL pre integráciu alebo C# O CR tutoriál pre návod, nájdete všetko, čo budete potrebovať na efektívne využívanie API vo svojich projektoch.

Okrem toho, ak chcete využívať C# rozpoznávanie textu alebo použiť c# OCR knižnicu pre rôzne aplikácie, môžete preskúmať funkcie, ktoré Aspose ponúka na podporu týchto funkcií. ** C# oCR PDF SDK hodnotenie** je vynikajúcou príležitosťou experimentovať s schopnosťami tejto knihy, aby ste sa uistili, že nájdete správne riešenia pre vaše potreby.

Konečne, ak potrebujete vytiahnuť text z PDF v C# alebo použiť OCR API C #, dostupné funkcie C# OCR PDF zjednodušujú váš vývojový proces a zlepšujú funkčnosť vašej aplikácie.

More in this category