OCR PDF a extrakce textu z PDF v C# pomocí Aspose.OCR pro .NET API | File Format Processing Plugins for C# .NET Core

PDF dokumenty jsou nezbytné v mnoha obchodních procesech, často vyžadují programový přístup k jejich skenovanému obsahu. Odstranění textu z skenovaných PDF souborů může být náročné, zdůrazňující potřebu efektivních nástrojů. V tomto tutoriálu budeme zkoumat jak OCR PDF doklady a extrahovat text z PDF v C# pomocí spolehlivého Aspose.OCR pro .NET API, přední C# OCR PDF extrakční knihovna k dispozici pro bezplatné hodnocen.

Co se naučíte

V tomto článku se budeme zabývat následujícími tématy:

Přehled Aspose.OCR pro .NET API

Využijeme toho Aspose.OCR pro .NET API, .

Oheň obsahuje AsposeOcr třída, která poskytuje více metod pro operace OCR RecognizePdf (string, nastavení rozpoznávání dokument) Metoda je nezbytná pro extrahování textu z konkrétního PDF dokumentu DocumentRecognitionSettings třída umožňuje přizpůsobení procesu uznávání, zatímco RecognitionResult Třída zakapluje výsledky uznání.

Můžete Stáhněte si DLL API Nebo ji nainstalovat prostřednictvím NuGet:

PM> Install-Package Aspose.OCR

Kroků k OCR PDF a Extract Text v C#

Chcete-li provést OCR na PDF dokumentech a extrahovat uznaný text, postupujte podle těchto krok:

Vytvořte příklad třídy AsposeOcr.
Začněte s objektem třídy DokumentRecognitionSettings.
Zadejte jazyk pro OCR.
Získejte RecognitionResult tím, že se obrátíte na RekognizePdf() metodu, procházejte obrazovou cestou a DocumentRecognitionSettings a předmětem.
Projděte přes seznam RecognitionResult a zobrazte identifikovaný text.

Zde je příklad, který ilustruje jak získat OCR PDF dokumenty a extrahovat uznávaný text v C#:

OCR PDF a extrahovat text z PDF v C#

Jak provést OCR na PDF a uložit text v C#

Chcete-li provést OCR na PDF dokumentech a uložit uznávaný text, postupujte podle následujících krok:

Vytvořte příklad třídy AsposeOcr.
Začněte s objektem třídy DokumentRecognitionSettings.
Zadejte jazyk pro OCR.
Zavolejte RecognizePdf() metodu a získejte RecognitionResult.
Shromažďujte text pomocí metody SaveMultipageDocument(), která vyžaduje cestu výstupního souboru SaveFormat, A to i s RecognitionResult a předmětem.

Zde je příklad, který ukazuje jak získat OCR PDF dokumenty a uložit uznávaný text v C#:

Proveďte OCR na PDF a uložte text v C#

Převod OCR PDF na Word v C#

Chcete-li převést skenované PDF dokumenty na Word, postupujte podle stejných kroků, jak je uvedeno dříve, ale v konečném kroku specifikujte SaveFormat.Docx.

Zde je příklad, který ilustruje jak se dostat do OCR PDF a uložit uznaný text jako Word dokument v C#:

OCR PDF a Convert Scanned PDF to Word v C#

Převod OCR PDF na JSON v C#

Chcete-li uložit rozpoznaný text z PDF dokumentů v souboru JSON, postupujte podle předchozích kroků s jedinou změnou, která je specifikovat SaveFormat.Json v konečném kroku.

Zde je příklad, který ukazuje jak se dostat do OCR PDF a uložit uznaný text jako soubor JSON v C#:

Získejte bezplatnou licenci pro hodnocení

Můžete Získejte bezplatnou dočasnou licenci pro hodnocení Aspose.OCR pro .NET API bez jakýchkoliv omezení.

závěr

V tomto tutoriálu jsme se dozvěděli, jak provádět OCR na PDF dokumentech a extrahovat text z PDF v C TXT, DOKX, a JSON Pro více informací o Aspose.OCR pro .NET API, zkontrolujte jeho Dokumentace. Pokud máte jakékoliv dotazy, cítit se svobodně k nám na našich Fórum.

Vidět také

Používáním Aspose.OCR pro .NET API, můžete implementovat vysokou přesnost PDF OCR v C# pro různé aplikace, včetně C# Účetní úprava a zpracování formulářů. Toto výhodné řešení PDF O CR je ideální pro vývojáře, kteří chtějí efektivně integrovat OCR PDF kapacity do svých aplikací.

Kromě toho, pokud potřebujete konvertovat PDF na text v C#, tento API poskytuje jednoduché řešení. Pro ty, kteří se zajímají o C# OCR PDF do textu schopnosti, integrace je bezproblémová, což umožňuje efektivní textové extrakce z různých formátů dokumentu. Můžete také použít funkci c# Convert PDF to Text snadno zvládnout textový extrakt z PDF, takže váš vývojový proces je hladší.

Pokud hledáte Aspose OCR C# Příklad, tento průvodce slouží jako komplexní zdroj. Kromě toho, pro zajímavé úkoly, jako je používání C# API, tento tutoriál pokrývá všechny základní prvky potřebné k efektivnímu zahájení. Navíc, pokud chcete extract text from PDF using C #, schopnosti API Aspose oCR bude výrazně zlepšit vaše pracovní toky.

Pro ty, kteří chtějí hodnotit PDF SDK a software pro zpracování dokumentů společnost Aspose na OCR PDFSDK, tento tutoriál slouží jako vynikající výchozí bod pro pochopení jeho schopností. Ať už potřebujete C# CCR DLL pro integraci nebo c# oCR tutorial za průvodce, najdete vše, co budete potřebovat k efektivnímu využití API ve svých projektech.

Kromě toho, pokud chcete využít C# rozpoznávání textu nebo použít knihovnu C# OCR pro různé aplikace, můžete prozkoumat funkce, které Aspose nabízí k podpoře těchto funkcí.

Konečně, pokud budete muset vyjmout text z PDF v C#, nebo použít OCR API C # , dostupné funkce C# OCR PDF usnadní váš vývojový proces a zlepší funkčnost vaší aplikace.

Co se naučíte#

Přehled Aspose.OCR pro .NET API#

Kroků k OCR PDF a Extract Text v C##

Jak provést OCR na PDF a uložit text v C##

Převod OCR PDF na Word v C##

Převod OCR PDF na JSON v C##

Získejte bezplatnou licenci pro hodnocení#

závěr#

Vidět také#

More in this category