
PDF dokumenty jsou nezbytné v mnoha obchodních procesech, často vyžadují programový přístup k jejich skenovanému obsahu. Odstranění textu z skenovaných PDF souborů může být náročné, zdůrazňující potřebu efektivních nástrojů. V tomto tutoriálu budeme zkoumat jak OCR PDF doklady a extrahovat text z PDF v C# pomocí spolehlivého ASPOSE.OCR pro .NET API, přední C# OCR PDF extrakční knihovna k dispozici pro bezplatné hodnocen.
Co se naučíte
V tomto článku se budeme zabývat následujícími tématy:
- Přehled Aspose.OCR pro .NET API
- Kroků k OCR PDF a extrahovat text
- Jak provést OCR na PDF a uložit text
- Převod OCR PDF na Word
- Převod OCR PDF na JSON
Přehled Aspose.OCR pro .NET API
Využijeme toho ASPOSE.OCR pro .NET API, .
Oheň obsahuje AsposeOcr třída, která poskytuje více metod pro operace OCR RecognizePdf (string, nastavení rozpoznávání dokument) Metoda je nezbytná pro extrahování textu z konkrétního PDF dokumentu DocumentRecognitionSettings třída umožňuje přizpůsobení procesu uznávání, zatímco RecognitionResult Třída zakapluje výsledky uznání.
Můžete Stáhněte si DLL API Nebo ji nainstalovat prostřednictvím NuGet:
PM> Install-Package Aspose.OCR
Kroků k OCR PDF a Extract Text v C#
Chcete-li provést OCR na PDF dokumentech a extrahovat uznaný text, postupujte podle těchto krok:
- Vytvořte příklad třídy AsposeOcr.
- Začněte s objektem třídy DokumentRecognitionSettings.
- Zadejte jazyk pro OCR.
- Získejte RecognitionResult tím, že se obrátíte na RekognizePdf() metodu, procházejte obrazovou cestou a DocumentRecognitionSettings a předmětem.
- Projděte přes seznam RecognitionResult a zobrazte identifikovaný text.
Zde je příklad, který ilustruje jak získat OCR PDF dokumenty a extrahovat uznávaný text v C#:
OCR PDF a extrahovat text z PDF v C#
Jak provést OCR na PDF a uložit text v C#
Chcete-li provést OCR na PDF dokumentech a uložit uznávaný text, postupujte podle následujících krok:
- Vytvořte příklad třídy AsposeOcr.
- Začněte s objektem třídy DokumentRecognitionSettings.
- Zadejte jazyk pro OCR.
- Zavolejte RecognizePdf() metodu a získejte RecognitionResult.
- Shromažďujte text pomocí metody SaveMultipageDocument(), která vyžaduje cestu výstupního souboru SaveFormat, A to i s RecognitionResult a předmětem.
Zde je příklad, který ukazuje jak získat OCR PDF dokumenty a uložit uznávaný text v C#:
Proveďte OCR na PDF a uložte text v C#
Převod OCR PDF na Word v C#
Chcete-li převést skenované PDF dokumenty na Word, postupujte podle stejných kroků, jak je uvedeno dříve, ale v konečném kroku specifikujte SaveFormat.Docx.
Zde je příklad, který ilustruje jak se dostat do OCR PDF a uložit uznaný text jako Word dokument v C#:
OCR PDF a Convert Scanned PDF to Word v C#
Převod OCR PDF na JSON v C#
Chcete-li uložit rozpoznaný text z PDF dokumentů v souboru JSON, postupujte podle předchozích kroků s jedinou změnou, která je specifikovat SaveFormat.Json v konečném kroku.
Zde je příklad, který ukazuje jak se dostat do OCR PDF a uložit uznaný text jako soubor JSON v C#:
Získejte bezplatnou licenci pro hodnocení
Můžete Získejte bezplatnou dočasnou licenci pro hodnocení Aspose.OCR pro .NET API bez jakýchkoliv omezení.
závěr
V tomto tutoriálu jsme se dozvěděli, jak provádět OCR na PDF dokumentech a extrahovat text z PDF v C TXT, DOKX, a JSON Pro více informací o Aspose.OCR pro .NET API, zkontrolujte jeho Dokumentace. Pokud máte jakékoliv dotazy, cítit se svobodně k nám na našich Fórum.
Vidět také
- Převod obrazovky do textu s OCR v C#
- OCR Image to Text a Spelling Correction v C#
- Konvertovat skenované PDF na vyhledatelné PDF s OCR v C#
Používáním Aspose.OCR pro .NET API, můžete implementovat vysokou přesnost PDF OCR v C# pro různé aplikace, včetně C# Účetní úprava a zpracování formulářů. Toto výhodné řešení PDF O CR je ideální pro vývojáře, kteří chtějí efektivně integrovat OCR PDF kapacity do svých aplikací.
Kromě toho, pokud potřebujete konvertovat PDF na text v C#, tento API poskytuje jednoduché řešení. Pro ty, kteří se zajímají o C# OCR PDF do textu schopnosti, integrace je bezproblémová, což umožňuje efektivní textové extrakce z různých formátů dokumentu. Můžete také použít funkci c# Convert PDF to Text snadno zvládnout textový extrakt z PDF, takže váš vývojový proces je hladší.
Pokud hledáte Aspose OCR C# Příklad, tento průvodce slouží jako komplexní zdroj. Kromě toho, pro zajímavé úkoly, jako je používání C# API, tento tutoriál pokrývá všechny základní prvky potřebné k efektivnímu zahájení. Navíc, pokud chcete extract text from PDF using C #, schopnosti API Aspose oCR bude výrazně zlepšit vaše pracovní toky.
Pro ty, kteří chtějí hodnotit PDF SDK a software pro zpracování dokumentů společnost Aspose na OCR PDFSDK, tento tutoriál slouží jako vynikající výchozí bod pro pochopení jeho schopností. Ať už potřebujete C# CCR DLL pro integraci nebo c# oCR tutorial za průvodce, najdete vše, co budete potřebovat k efektivnímu využití API ve svých projektech.
Kromě toho, pokud chcete využít C# rozpoznávání textu nebo použít knihovnu C# OCR pro různé aplikace, můžete prozkoumat funkce, které Aspose nabízí k podpoře těchto funkcí.
Konečně, pokud budete muset vyjmout text z PDF v C#, nebo použít OCR API C # , dostupné funkce C# OCR PDF usnadní váš vývojový proces a zlepší funkčnost vaší aplikace.