Convert PDF to TXT in C#

作为一个程序员,你经常需要从 PDF 文件中提取内容作为清晰的文本进行进一步处理,如分析和信息提取。 处理 PDF 文件并将整个 PDF 转换为 TXT 格式是一个麻烦的任务,当你没有正确的工具。

C# 图书馆为 PDF 转换为 TXT {# 图书馆转换为 DOC 转换为 TXT}

[Aspose.Words for .NET][1] 是一个令人惊叹的文档处理 API,允许开发人员使用 Word 文档以及各种其他格式,包括 PDF. 其广泛的功能,Aspose.Words 简化文档操作,转换和生成任务. 我们将使用此图书馆将 PDF 文件转换为 TXT 格式在 .NET 应用程序。

您可以使用下列命令从 [NuGet][5] 安装图书馆,或者从 [Releases][6] 部分下载其 DLL。

PM> Install-Package Aspose.Words 

将 PDF 转换为 TXT 在 C#

Aspose.Words for .NET 隐藏了从 PDF 文件中提取文本的所有复杂操作,并允许您在以下几步中进行 PDF 转换为 TXT。

  • 下载 PDF 文件。
  • 通过单个函数呼叫将 PDF 转换为 TXT 格式。

因此,使用几行代码,您可以将 PDF 文件中的内容转换为清晰的文本,无论 PDF 来源有多大。

  • 首先,使用 文件 类下载 PDF。
  • 然后将文档保存为 TXT 文件,使用 Document.Save(filePath) 方法。

下面的 C# 代码剪辑将 PDF 转换为 TXT 格式。

获取免费 API 许可证

您可以获得 [免费临时许可证][2] 将 PDF 文件转换为 TXT 格式,而无需评估限制。

结论

在此博客帖子中,我们探索如何将 PDF 转换为 TXT 在 C# 使用 Aspose.Words 为 .NET 图书馆. 遵循指南并使用代码剪辑,您可以轻松地处理大 PDF 文件并将其转换为平板文本. Aspose.Words 简化文档处理任务,使其成为开发人员在他们的应用程序中使用各种文档格式的有价值工具。

More in this category