PDF 文件在许多业务流程中至关重要,往往需要编程访问其扫描内容。从扫除的 PDF 在文件中提取文本可能具有挑战性,强调有效的工具的必要性. 在此教学中,我们将探讨 如何到 OCR PDF 文档和从 C# 中的 PDF 中提交文献 使用可靠的 ASPOSE.OCR 为 .NET API, 一个领先的 C# OCR PDF 提取图书馆 可免费评估.

你会学到的

在这篇文章中,我们将讨论以下主题:

对 .NET API 的 Aspose.OCR 的概述

我们将利用 ASPOSE.OCR 为 .NET API, .

火焰指的是 AsposeOcr 分类,提供多种方法的OCR操作 识别PDF(string、DocumentRecognitionSettings) 方法是从特定 PDF 文档中提取文本的必需品 DocumentRecognitionSettings 班级允许定制识别过程,而 RecognitionResult 班级将认可的结果包容.

你可以 下载 API 的 DLL 或者通过安装 NuGet:

PM> Install-Package Aspose.OCR

步骤到 OCR PDF 并在 C# 中提取文本

要在 PDF 文档上执行 OCR 并提取已认可的文本,请遵循以下步骤:

  • 创建一个例子 AsposeOcr 类.
  • DocumentRecognitionSettings 类中启动一个对象.
  • 指定 OCR 的语言.
  • 通过使用 RecognizePdf() 方法,通过图像路径和 DocumentRecognitionSettings 对象.
  • 通过 RecognitionResult 列表显示已识别的文本.

以下是一個例子,顯示 如何到OCR PDF文件和提取認可的文本在C#:

OCR PDF 和从 PDF 提取文本在 C#

如何在 PDF 上执行 OCR 并在 C# 中保存文本

要在 PDF 文档上执行 OCR 并保存已认可的文本,请遵循以下步骤:

  • 创建一个例子 AsposeOcr 类.
  • DocumentRecognitionSettings 类中启动一个对象.
  • 指定 OCR 的语言.
  • 请使用 RecognizePdf() 方法获取 RecognitionResult.
  • 使用 SaveMultipageDocument() 方法保存文本,需要输出文件路径 SaveFormat, 而其 RecognitionResult 对象.

以下是示示 如何将 OCR PDF 文件存储在 C# 中#:

在 PDF 上执行 OCR 并在 C# 中保存文本#

将 OCR PDF 转换为 Word 在 C#

要将扫描的 PDF 文档转换为 Word,请按照上述步骤进行转换,但在最后步骤中指定 SaveFormat.Docx.

下面是一個例子,顯示 如何轉換 OCR PDF 並保存已認識的文本作為 Word 文本在 C#:

OCR PDF 并将扫描的 PDF 转换为 Word 在 C#

将 OCR PDF 转换为 JSON 在 C#

要从 PDF 文件中保存已识别的文本,请在 JSON 文件中遵循前一步,在最后步骤中只需指定 SaveFormat.Json.

以下是示示 如何到 OCR PDF 并在 C# 中保存已认可的文本作为 JSON 文件的示例#:

获得免费评估许可证

你可以 获得免费的临时许可证 为 .NET API 进行 Aspose.OCR 评估,无限制.

结论

在本教程中,我们学会了如何在PDF文档上进行OCR,并从PDF中提取文本以C TXT, 多克斯, 和 JSON 要了解更多关于 .NET API 的 Aspose.OCR 的信息,请查看其 人们在说什么. 如果您有任何疑问,请自由地在我们的 论坛.

看也

通过使用 Aspose.OCR for .NET API,您可以在 C# 中实施高准确性 PDF OCR 各种应用程序,包括 C# 账单处理和表格处理。 此 可用的 .NET PDF O CR 解决方案 为开发人员提供完美的功能,以便能够有效地将 OCR PDF 的功能集成到他们的应用中.

此外,如果您需要将 PDF 转换为 C# 文本,则此 API 提供了一个简单的解决方案。对于那些对 C# OCR PDF to text 的功能感兴趣的人来说,整合是无缝的,允许从各种文档格式中有效地提取文件.

如果您正在寻找一个 Aspose OCR C# 示例,本指南将作为一个全面的资源。 此外,对于像 C#OCR API 使用这样的复杂任务,该教程涵盖了所有必要的基本元素,以便有效地开始.

对于那些想要 评估 PDF SDK 和文档处理软件公司 Aspose 在 OCR PDFSDK,这个教程作为一个很好的出发点来了解它的能力.

此外,如果您想利用 C# 文本识别 或使用 C# OCR 图书馆 为各种应用程序,您可以探索 Aspose 提供支持这些功能的功能.

最后,如果您需要从 PDF 中提取文本,或者使用 OCR API C#,则可用的 C# OCR PDF 功能将简化您的开发过程,并提高应用程序的功能.

More in this category