
PDF dokumenty sú nevyhnutné v mnohých obchodných procesov, často vyžadujú programatický prístup k ich skenovanému obsahu. Odstránenie textu z skenovaných PDF súborov môže byť náročné, zdôrazňujúce potrebu efektívnych nástrojov. V tomto tutoriáli budeme preskúmať ako sa OCR PDF doklady a odstrániť text z PDF v C# pomocou spoľahlivého Aspose.OCR pre .NET API, popredná C# OCR PDF extrakcia knižnica k dispozícii pre bezplatnú hodnotenie.
Čo sa naučíte
V tomto článku sa budeme zaoberať nasledujúcimi témami:
- Prehľad Aspose.OCR pre .NET API
- Krok do OCR PDF a extrakt textu
- Ako vykonať OCR na PDF a uložiť text
- Konverzia OCR PDF na Word
- Konverzia OCR PDF na JSON
Prehľad Aspose.OCR pre .NET API
Budeme používať Aspose.OCR pre .NET API, robustný .NET PDF OCR API navrhnutý tak, aby rozpoznal text zo skenovaných obrázkov, smartfónových fotografií a snímok obrazovky, vrátia výsledky v rôznych formátoch dokumentu. Táto API nielen konvertuje obrázky do textu, ale tiež vytvára vyhľadávateľné PDF z skenovania a opravuje akúkoľvek chybu v zaznamenanom texte, čo je jedným z najrýchlejších C# PDF oCR riešení k dispozícii za len $99.
Oheň obsahuje AsposeOcr trieda, ktorá poskytuje viaceré metódy pre operácie OCR RecognizePdf(string, dokumentRecognitionNastavenia) metóda je nevyhnutná pre extrahovanie textu z konkrétneho PDF dokumentu DocumentRecognitionSettings trieda umožňuje prispôsobenie procesu uznávania, zatiaľ čo RecognitionResult trieda zakapsuluje výsledky uznania.
Môžeš Stiahnuť DLL z API alebo nainštalovať prostredníctvom NuGet:
PM> Install-Package Aspose.OCR
Krok do OCR PDF a extrahovať text v C#
Ak chcete vykonať OCR na PDF dokumentoch a extrahovať uznaný text, postupujte podľa týchto krokov:
- Vytvorte príklad triedy AsposeOcr.
- Initializujte objekt v triede DokumentRecognitionSettings.
- Zadajte jazyk pre OCR.
- Získajte RecognitionResult zavádzaním metódy RekognizePdf(), prechádzajúc obrazovou trasou a DocumentRecognitionSettings na objekty.
- Prejdite cez zoznam RecognitionResult a zobrazte identifikovaný text.
Tu je príklad, ktorý ilustruje ako sa OCR PDF dokumenty a extrahovať uznávaný text v C#:
OCR PDF a extrahovať text z PDF v C#
Ako vykonávať OCR na PDF a uložiť text v C#
Ak chcete vykonať OCR na PDF dokumentoch a uložiť uznaný text, postupujte podľa týchto krokov:
- Vytvorte príklad triedy AsposeOcr.
- Initializujte objekt v triede DokumentRecognitionSettings.
- Zadajte jazyk pre OCR.
- Zavolajte RecognizePdf() metódu, aby ste získali Rezultát pre poznanie.
- Uložiť text pomocou metódy SaveMultipageDocument(), ktorá vyžaduje cestu výstupného súboru SaveFormat, a to aj s RecognitionResult na objekty.
Tu je príklad ukázať ako sa OCR PDF dokumenty a uložiť uznaný text v C#:
Vykonávať OCR na PDF a uložiť text v C#
Konvertovanie OCR PDF na Word v C#
Ak chcete previesť naskenované PDF dokumenty do programu Word, postupujte podľa tých istých krokov, ako bolo uvedené skôr, ale v konečnom kroku uveďte SaveFormat.Docx.
Tu je príklad, ktorý ilustruje ako sa OCR PDF a uložiť uznaný text ako Word dokument v C#:
OCR PDF a Convert Scanned PDF to Word v C#
Konvertovanie OCR PDF na JSON v C#
Ak chcete uložiť uznávaný text z dokumentov PDF v súbore JSON, postupujte podľa predchádzajúcich krokov s jedinou zmenou, aby ste v konečnom kroku uviedli SaveFormat.Json.
Tu je príklad ukázať ako sa OCR PDF a uložiť uznaný text ako JSON súbor v C#:
Získajte bezplatnú hodnotenie
Môžeš Získajte bezplatnú dočasnú licenciu vyhodnotiť Aspose.OCR pre .NET API bez akýchkoľvek obmedzení.
Záver
V tomto tutoriáli sme sa dozvedeli, ako vykonávať OCR na PDF dokumentoch a extrahovať text z PDF v C TXT, DOKX, a JSON Pre viac informácií o Aspose.OCR pre .NET API, skontrolujte jeho dokumentácia. Ak máte akékoľvek otázky, cítite sa slobodne k nám prichádzať na našich Fórum.
Pozri tiež
- Konvertovať snímky obrazovky na text s OCR v C#
- OCR Image to Text a Spelling Correction v C#
- Konvertovať skenované PDF na vyhľadávateľné PDF s OCR v C#
Používaním Aspose.OCR pre .NET API môžete implementovať vysokú presnosť PDF OCR v C# pre rôzne aplikácie, vrátane spracovania C# O CR faktúry a manipulácie s formulármi. Toto výhodné riešenie .NET PDF Ocr je ideálne pre vývojárov, ktorí chcú efektívne integrovať OCR PDF schopnosti do svojich aplikácií.
Okrem toho, ak potrebujete konvertovať PDF do textu v C#, táto API poskytuje jednoduché riešenie. Pre tých, ktorí sa zaujímajú o C# OCR PDF na text schopnosti, integrácia je bezproblémová, čo umožňuje efektívnu textovú extrakciu z rôznych formátov dokumentu. Môžete tiež použiť funkciu Convert PDF to Text na ľahké zaobchádzanie s textovou extraciou z PDF, čím sa váš vývojový proces vylepšuje.
Ak hľadáte Aspose OCR C# Example, tento sprievodca slúži ako komplexný zdroj. Okrem toho, pre zaujímavé úlohy, ako je C# API použitie, táto príručka pokrýva všetky základné prvky potrebné na efektívne začatie. Navyše, ak chcete extract text z PDF pomocou C # , schopnosti API Aspose oCR výrazne zvýši vaše pracovné toky.
Pre tých, ktorí chcú hodnotiť PDF SDK a softvérovú spoločnosť na spracovanie dokumentov Aspose na OCR PDFSDK, tento výukový program slúži ako vynikajúci východiskový bod na pochopenie jeho schopností. Či už potrebujete C# DLL pre integráciu alebo C# O CR tutoriál pre návod, nájdete všetko, čo budete potrebovať na efektívne využívanie API vo svojich projektoch.
Okrem toho, ak chcete využívať C# rozpoznávanie textu alebo použiť c# OCR knižnicu pre rôzne aplikácie, môžete preskúmať funkcie, ktoré Aspose ponúka na podporu týchto funkcií. ** C# oCR PDF SDK hodnotenie** je vynikajúcou príležitosťou experimentovať s schopnosťami tejto knihy, aby ste sa uistili, že nájdete správne riešenia pre vaše potreby.
Konečne, ak potrebujete vytiahnuť text z PDF v C# alebo použiť OCR API C #, dostupné funkcie C# OCR PDF zjednodušujú váš vývojový proces a zlepšujú funkčnosť vašej aplikácie.